[討論] DeepSeek消息的三大誤區
本來標題想寫謠言的,但有些部份可能只是基於對技術名詞不熟悉產生的誤解,我姑且不假設發佈源頭是有意為之
誤區1:DeepSeek和微軟、NVIDIA、HuggingFace等公司合作
DeepSeek是MIT Licence的開源軟體,簡單說就是可以修改及商用的,它所謂的開源包含訓練程式碼和權重,那些雲端服務公司拿開源的DeepSeek上架到他們的服務平台,使用者可以將DeepSeek部署到自己的應用中,這樣算不算一種「合作」,我覺得2:8吧,但我問了Copilot它是說不算啦
https://i.imgur.com/hz2gtdN.jpeg
同樣問題我拿去問DS-r1,它直接說沒合作,但由於DS現在不能聯網搜索最新資訊所以就不參考它的答案
不過這些公司在發佈時都有稱讚DeepSeek的「優秀」,這不容否認
誤區2. DS用PTX語言開發可以繞過CUDA
其實任何演算法本來就可以不用cuda,那為何要讓「繞過CUDA」聽起來像一種魔法?我就不說了
DeepSeek 透過 PTX 語言直接呼叫 GPU 硬體資源,是基於直接實現工程師的想法而跳過編譯器的決策,但這並不代表沒有用到CUDA硬體。相反地,你寫越多PTX代碼反而越依賴於輝達的硬體而增加移植的難度
誤區3. 高階晶片將無用武之地
無論是在DS出現之前還是之後,高階和低階 GPU 都能執行 AI 運算,但差異在於運算速度和效率。
DS的出現或許一定程度的削弱了AI先驅者(OpenAI等) 的壟斷地位,但不能保證未來各公司還是會繼續在硬體資源上競逐,畢竟預算充足下誰不想要更快?
另外以前就有一些分析以「租用」的角度來比較,高階GPU不僅更快達成目標,還省下以時間計費的租金成本。
--
Pentium II就可以玩世紀帝國 我幹嘛
花大錢換i7?
那川普要課台灣晶片稅有啥誤區可共創雙贏阿
幽默 什麼叫做CUDA硬體
推
CUDA本來就是硬體啊
那個…台灣人不用誤區的欸,不都說常見錯
誤
6樓,cuda 真的不是硬體
CUDA嚴格來說確實是軟體,但是當人們說 "4096有16384個cuda核心" 時又帶有硬體的概念 在這種事上爭論根本沒有針對到事情本質
共產黨花巨資創建的資料中心只有中國掌
控的廠商能用所以資料中心不算deepseek
的中國人最愛玩這招
不不不,CUDA也不是硬體,是一種運算架構
,其中包含了軟體開發環境
更正,也不是軟體
同時CUDA是基於NVDIA 提供的驅動,其中又
包含了韌體,所以有時候口語化的說法會那
樣描述,實際上那不是一個完全正確的說法
24
[爆卦] openAI 首席研究員來自台灣Deepseek事件後 OpenAI首席研究Mark chen 出來回應Deepseek Mark chen 2012年畢業於MIT16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中22
Re: [新聞] DeepSeek顛覆AI產業模式!曝中國2大發展LLM經過這三年發展已展現其潛力,但也陷入(公開)知識枯竭造成的瓶頸 網路爬蟲能抓的都已訓練完 AI模型如還需增加功力,只能望向各家機構(公司)的商業祕密 比如DS團隊使用低階語言PTX來增加GPU計算效率 此部分的知識儲備,據說來自母公司幻化量方過往最佳化量化交易模型的經驗15
Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成《轉載》 網路上傳deepseek繞過了輝達cuda,我跟大家講一下deepseek到底做了什麼。 輝達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用輝達的顯卡做高性能計算,就要透過cuda計算平台。 你說用AMD的顯示卡,嗨,它沒有生態呀,就像android和windows phone那麼大的差別。 你買蘋果手機,不是買的硬體,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 輝達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。 總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了輝達別無選擇,這就是過去十年AI圈的現實 ,天下苦達子久矣。X
Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?剛剛看到最新分析 跳過 CUDA,Deepseek 用精細的 PTX 寫成 韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過 大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。 所以他不用cuda![Re: [討論] 藍白為什麼連蹭Deepseek都能翻車? Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?](https://i.imgur.com/rcylSPZb.png)
7
[請益] DeepSeek 會不會反加大中美 AI 差距最近中國的 AI 團隊 DeepSeek 宣布了一個大突破,透過 DualPipe、FP8 低精度計算、 通訊優化 這些技術,讓 AI 訓練的效率大幅提升,意思就是說 用比較少的 GPU 就能達 到原本需要超大量 GPU 才能完成的 AI 訓練。 表面上看起來這對中國 AI 產業是個好消息,因為 美國對中國禁售高端 GPU,中國 AI 企業的算力一直是硬傷。所以很多人說deepseek是中國彎道超車,讓中國即使不用美國高4
[討論] deepseek 主要創新點應該是繞過cuda看了一下討論 發現ds 主要有關ai 的部分如同老美的說法 但加速的關鍵主要還是來自於用組合語言直接寫 原本都還得透過cuda 這是nv 的技術護城河![[討論] deepseek 主要創新點應該是繞過cuda [討論] deepseek 主要創新點應該是繞過cuda](https://i.imgur.com/TJAtdO3b.jpeg)
5
[問卦] deepseek 說輝達是現代石油公司?以下是我題問的問題 1.目前都說,因為演算法的進步,未來不需要英偉達那麼多gpu算力那麼多是真的嗎? Deepseek 回答如下: 從技術發展的多元角度來看,**演算法進步確實會提升計算效率,但短期內對GPU算力的 需?4
Re: [新聞] 繞開輝達護城河 陸媒傳DeepSeek可改適配我有問題 我去查了PTX 意思就是GPU的組合語言 如果用CUDA寫的是高階語言 你用組合語言寫的話X
Re: [討論] Deepseek 繞開cuda 用任何GPU都可以認真說,這是使用PTX語言寫的,而PTX依然是NVDA在維護的東西 『尚未』繞過NVDA 但 能這麼做,就表示具備能力可以可以針對AMD 針對AppleM 甚至針對華為910B 去針對優化編譯 直接跟底層硬體溝通![Re: [討論] Deepseek 繞開cuda 用任何GPU都可以 Re: [討論] Deepseek 繞開cuda 用任何GPU都可以](https://i.imgur.com/ozg9NCLb.jpg?fb)