PTT推薦

[討論] DeepSeek消息的三大誤區

看板HatePolitics標題[討論] DeepSeek消息的三大誤區作者
z1976
(z1976)
時間推噓 6 推:7 噓:1 →:11

本來標題想寫謠言的,但有些部份可能只是基於對技術名詞不熟悉產生的誤解,我姑且不假設發佈源頭是有意為之

誤區1:DeepSeek和微軟、NVIDIA、HuggingFace等公司合作

DeepSeek是MIT Licence的開源軟體,簡單說就是可以修改及商用的,它所謂的開源包含訓練程式碼和權重,那些雲端服務公司拿開源的DeepSeek上架到他們的服務平台,使用者可以將DeepSeek部署到自己的應用中,這樣算不算一種「合作」,我覺得2:8吧,但我問了Copilot它是說不算啦
https://i.imgur.com/hz2gtdN.jpeg

圖 DeepSeek消息的三大誤區

同樣問題我拿去問DS-r1,它直接說沒合作,但由於DS現在不能聯網搜索最新資訊所以就不參考它的答案

不過這些公司在發佈時都有稱讚DeepSeek的「優秀」,這不容否認

誤區2. DS用PTX語言開發可以繞過CUDA

其實任何演算法本來就可以不用cuda,那為何要讓「繞過CUDA」聽起來像一種魔法?我就不說了

DeepSeek 透過 PTX 語言直接呼叫 GPU 硬體資源,是基於直接實現工程師的想法而跳過編譯器的決策,但這並不代表沒有用到CUDA硬體。相反地,你寫越多PTX代碼反而越依賴於輝達的硬體而增加移植的難度

誤區3. 高階晶片將無用武之地

無論是在DS出現之前還是之後,高階和低階 GPU 都能執行 AI 運算,但差異在於運算速度和效率。

DS的出現或許一定程度的削弱了AI先驅者(OpenAI等) 的壟斷地位,但不能保證未來各公司還是會繼續在硬體資源上競逐,畢竟預算充足下誰不想要更快?

另外以前就有一些分析以「租用」的角度來比較,高階GPU不僅更快達成目標,還省下以時間計費的租金成本。

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.81.161.20 (臺灣)
PTT 網址
※ 編輯: z1976 (111.81.161.20 臺灣), 02/03/2025 00:06:43

meredith001 02/03 00:09Pentium II就可以玩世紀帝國 我幹嘛

meredith001 02/03 00:09花大錢換i7?

※ 編輯: z1976 (111.81.161.20 臺灣), 02/03/2025 00:27:38

ken85 02/03 00:32那川普要課台灣晶片稅有啥誤區可共創雙贏阿

miracle210 02/03 00:47幽默 什麼叫做CUDA硬體

cutsadh 02/03 01:05

HenryLin123 02/03 02:21CUDA本來就是硬體啊

iampig951753 02/03 02:27https://i.imgur.com/QTMWEMp.jpeg

圖 DeepSeek消息的三大誤區

vbhero 02/03 02:54那個…台灣人不用誤區的欸,不都說常見錯

vbhero 02/03 02:54

vbhero 02/03 02:566樓,cuda 真的不是硬體

CUDA嚴格來說確實是軟體,但是當人們說 "4096有16384個cuda核心" 時又帶有硬體的概念 在這種事上爭論根本沒有針對到事情本質

jay3u7218 02/03 08:46共產黨花巨資創建的資料中心只有中國掌

jay3u7218 02/03 08:46控的廠商能用所以資料中心不算deepseek

jay3u7218 02/03 08:46的中國人最愛玩這招

※ 編輯: z1976 (125.227.176.110 臺灣), 02/03/2025 09:39:35

vbhero 02/03 11:45不不不,CUDA也不是硬體,是一種運算架構

vbhero 02/03 11:45,其中包含了軟體開發環境

vbhero 02/03 11:46更正,也不是軟體

vbhero 02/03 11:49同時CUDA是基於NVDIA 提供的驅動,其中又

vbhero 02/03 11:49包含了韌體,所以有時候口語化的說法會那

vbhero 02/03 11:49樣描述,實際上那不是一個完全正確的說法