Re: [討論] DeepSeek消息的三大誤區
※ 引述《z1976 (z1976)》之銘言:
: 本來標題想寫謠言的,但有些部份可能只是基於對技術名詞不熟悉產生的誤解,我姑且不: 假設發佈源頭是有意為之
: 誤區1:DeepSeek和微軟、NVIDIA、HuggingFace等公司合作
: DeepSeek是MIT Licence的開源軟體,簡單說就是可以修改及商用的,它所謂的開源包含: 訓練程式碼和權重,那些雲端服務公司拿開源的DeepSeek上架到他們的服務平台,使用者: 可以將DeepSeek部署到自己的應用中,這樣算不算一種「合作」,我覺得2:8吧,但我問: 了Copilot它是說不算啦
: https://i.imgur.com/hz2gtdN.jpeg

: 不過這些公司在發佈時都有稱讚DeepSeek的「優秀」,這不容否認
: 誤區2. DS用PTX語言開發可以繞過CUDA
: 其實任何演算法本來就可以不用cuda,那為何要讓「繞過CUDA」聽起來像一種魔法?我就: 不說了
: DeepSeek 透過 PTX 語言直接呼叫 GPU 硬體資源,是基於直接實現工程師的想法而跳過: 編譯器的決策,但這並不代表沒有用到CUDA硬體。相反地,你寫越多PTX代碼反而越依賴: 於輝達的硬體而增加移植的難度
小弟是擔任10年資歷以上的韌體工程師,所以對於這討論很有感:
我剛好也學過一點AI CUDA等東西,那我會把PTX跟CUDA做以下的類比
CUDA: C++ Python等高階語言
PTX: 組合語言
我以前在學組合語言的時候就發現,組合語言開發出來的程式就會比c++小很多,
而且執行速度更快,但缺點就是很難維護,只要有一個 bug出現,就要有de到死
的心理準備,而且很難移植到其他的硬體平台。
譬如x86的組合語言就跟Arm的組合語言不一樣,簡單上來說,在x86上面開發的組合語言是沒有辦法在Arm的機器上面跑。
現在很多人說 DeepSeek繞過了CUDA, 所以不必被Nvidia綁死,我看了其實滿腦的黑人問號。DeepSeek這樣搞,就更只會被Nvidia綁死,因為根本無法移植到non-Nividia的
機器跑,但是這樣做確實有好處,因為在現實的軟體開發工作中,如果要拚效率的話
有時在c++的程式碼裡面會內嵌組合語言,呼叫特定的指令集(instrunction set)
來加速運算效率。
我曾經寫過一個程式是跑fft的,如果只是單純用CPU來跑的話,可能
需要10 ms左右,但如果使用intel裡面支援的dsp instruction來寫的話,可以快到1~2
ms,
所以至少是快5倍以上,但這程式要移植到Mac上面去,那就要整個重寫,
因為Mac上面支援的dsp instruction set跟intel就是不一樣。
: 誤區3. 高階晶片將無用武之地
: 無論是在DS出現之前還是之後,高階和低階 GPU 都能執行 AI 運算,但差異在於運算速: 度和效率。
: DS的出現或許一定程度的削弱了AI先驅者(OpenAI等) 的壟斷地位,但不能保證未來各公: 司還是會繼續在硬體資源上競逐,畢竟預算充足下誰不想要更快?
: 另外以前就有一些分析以「租用」的角度來比較,高階GPU不僅更快達成目標,還省下以: 時間計費的租金成本。
高階gpu拿來跑訓練還是有必要的
沒辦法,當你要跑大資料的模型訓練的時候 ,高階的 gpu就真的很重要,
deepSeek的出現可以在終端上跑推理,也許不需要高端的gpu,但是要訓練出
deepseek那樣的模型,高階的GPU應該還是少不了的
大概是這樣
--
應該不用跑到黑悟空那種3A的程度吧?
幫推 但你這篇藍白共網軍聽不懂~
DS改善了一個問題 但後面問題還多著呢
只有白癡草會以為贏了
DS確實是一個重要的發展里程碑,至少我身邊有在弄AI的朋友都覺得DS 是一個重要的發展,敢把自己辛苦弄得東西開源,不簡單 但開源之後,應該會有比DS更強大的模型跑出來 就是這樣
※ 編輯: isaacting (49.218.88.28 臺灣), 02/03/2025 08:52:32組合語言 O.o 90 dos年代五專必修耶
等GPU到瓶頸時才值得這樣搞,中國可以因
為拿不到新晶片
他是說PTX是AI寫的
AI寫的code就能保證100%正確嗎? ...QQ 這完全是想太多惹..QQ 理論上DeepSeek改寫完是可以在AMD或是中國自產的GPU上面跑 這絕對是可行的,但就只是理論上.... 就好比我在intel上寫的 fft程式,改寫完理論上也可以在Mac上面跑 演算法沒有變阿 但理論畢竟就是理論...恩....
小草現在很開心他們用PTX寫
整個快笑死,那直接綁N卡硬體了
PTX也是NV提供的阿,到底繞過啥
換摩爾線程跑,我才佩服
AI 寫程式能正確的話,我看全世界的語言
工程師(程式語言)都要被解雇了唄
AI寫code目前只到讓工程師少打一些字的程度
專業推
如果是swe應該可以理解有能力寫ptx表示
有能力重寫移植到其他gpu/npu
理論上絕對是可行的! 但就是需要花時間心力而已啊~~~~~ 打個比方來說,作業系統的理論大家也都知道,Linux的code也都開源了 "理論上要從0寫出一套新的作業系統是可行的",但那就只是理論上而已 中國推出最新的作業系統還是Linux based的
※ 編輯: isaacting (49.218.88.28 臺灣), 02/03/2025 09:53:47許多媒體用「繞開CUDA」這個說法就有點騙
這幾天的新聞就有deepseek model infere
nce的部分在amd比NV同級卡快的新聞,推
測就是因為在amd有做優化..
絕對是這樣~~~演算法的架構不可能改變 就像在intel上面寫fft跟在mac上面寫fft的理論一定是一樣的 但是有沒有硬體的優化就可能會差很多
※ 編輯: isaacting (49.218.88.28 臺灣), 02/03/2025 10:01:20另外我是有點好奇intel那來dsp...你是在
說avx?
是的~~~專業 不過我是拿來做DSP處理,所以我印象中就是DSP指令集...
※ 編輯: isaacting (49.218.88.28 臺灣), 02/03/2025 10:03:34avx不是dsp...應該是非標準x86的instruc
tion set...所以某些程式用icc編譯的效
能會比gcc好很多..
16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中22
Re: [新聞] DeepSeek顛覆AI產業模式!曝中國2大發展LLM經過這三年發展已展現其潛力,但也陷入(公開)知識枯竭造成的瓶頸 網路爬蟲能抓的都已訓練完 AI模型如還需增加功力,只能望向各家機構(公司)的商業祕密 比如DS團隊使用低階語言PTX來增加GPU計算效率 此部分的知識儲備,據說來自母公司幻化量方過往最佳化量化交易模型的經驗15
Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成《轉載》 網路上傳deepseek繞過了輝達cuda,我跟大家講一下deepseek到底做了什麼。 輝達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用輝達的顯卡做高性能計算,就要透過cuda計算平台。 你說用AMD的顯示卡,嗨,它沒有生態呀,就像android和windows phone那麼大的差別。 你買蘋果手機,不是買的硬體,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 輝達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。 總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了輝達別無選擇,這就是過去十年AI圈的現實 ,天下苦達子久矣。9
Re: [討論] Deepseek 繞開cuda 用任何GPU都可以這種文章完全就是在造謠 用PTX寫程式繞開的是CUDA開發框架而不是CUDA硬體 PTX是CUDA開發框架產生的中繼語言,通常,演算法工程師撰寫的是高階語言 (C++或pyt hon) ,開發環境會將高階語言轉換成中繼語言 你能直接撰寫PTX是可以說繞過CUDA沒錯,但繞過的是指CUDA框架的API以及從高階語言轉4
[討論] deepseek 主要創新點應該是繞過cuda看了一下討論 發現ds 主要有關ai 的部分如同老美的說法 但加速的關鍵主要還是來自於用組合語言直接寫 原本都還得透過cuda 這是nv 的技術護城河![[討論] deepseek 主要創新點應該是繞過cuda [討論] deepseek 主要創新點應該是繞過cuda](https://i.imgur.com/TJAtdO3b.jpeg)
6
[情報] i皇6代以上內顯開CUDA加速 最高buff 52%本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼) 英文原文: 原作者Github:![[情報] i皇6代以上內顯開CUDA加速 最高buff 52% [情報] i皇6代以上內顯開CUDA加速 最高buff 52%](https://i.imgur.com/7QJsd9ob.jpg)
4
Re: [新聞] 繞開輝達護城河 陸媒傳DeepSeek可改適配我有問題 我去查了PTX 意思就是GPU的組合語言 如果用CUDA寫的是高階語言 你用組合語言寫的話2
Re: [新聞] DeepSeek梁文鋒放假消息做空輝達海撈?看來**量化真的有在套利 從「繞過CUDA」這種消息就可以知道他們在利用資訊差引發市場恐慌 寫PTX繞過的是CUDA高階語言API而不是繞過CUDA GPU,因為都叫cuda所以太好造謠了 你一個演算法本來就可以在各種硬體跑,這不是常識嗎?工程師移植功力好想在什麼阿貓 阿狗的GPU/CPU跑都是你的自由,把「繞過CUDA」講得好像別的GPU/CPU都可以跑出跟cudaX
Re: [討論] Deepseek 繞開cuda 用任何GPU都可以認真說,這是使用PTX語言寫的,而PTX依然是NVDA在維護的東西 『尚未』繞過NVDA 但 能這麼做,就表示具備能力可以可以針對AMD 針對AppleM 甚至針對華為910B 去針對優化編譯 直接跟底層硬體溝通![Re: [討論] Deepseek 繞開cuda 用任何GPU都可以 Re: [討論] Deepseek 繞開cuda 用任何GPU都可以](https://i.imgur.com/ozg9NCLb.jpg?fb)
52
[討論] 怎麼還有人看不懂這是黨內互打...49
[討論] 快訊/賴瑞隆兒涉「校園霸凌3同學」 陳![[討論] 快訊/賴瑞隆兒涉「校園霸凌3同學」 陳 [討論] 快訊/賴瑞隆兒涉「校園霸凌3同學」 陳](https://cdn2.ettoday.net/images/8523/e8523039.jpg)
38
[黑特] 黃國昌:為何只禁小紅書!![[黑特] 黃國昌:為何只禁小紅書! [黑特] 黃國昌:為何只禁小紅書!](https://i.imgur.com/9xka960b.jpeg)
47
[討論] 邱議瑩:校園安全事件 應儘速釐清責任![[討論] 邱議瑩:校園安全事件 應儘速釐清責任 [討論] 邱議瑩:校園安全事件 應儘速釐清責任](https://i.imgur.com/aubneWAb.png)
42
[討論] cheap大發聲支持小紅書了![[討論] cheap大發聲支持小紅書了 [討論] cheap大發聲支持小紅書了](https://i.meee.com.tw/1s4VAFF.jpg)
42
[討論] 賴瑞隆現在怎麼處理自己小孩能解套!?49
[討論] 下週就不會洗賴瑞隆了,明年選舉更不用說![[討論] 下週就不會洗賴瑞隆了,明年選舉更不用說 [討論] 下週就不會洗賴瑞隆了,明年選舉更不用說](https://i.imgur.com/xrM9Xapb.jpeg)
32
[討論] 青鳥8歲會打人嗎![[討論] 青鳥8歲會打人嗎 [討論] 青鳥8歲會打人嗎](https://i.imgur.com/eg9lLGab.jpg)
32
[討論] 會不會繞一圈又是黃捷臨危受命?![[討論] 會不會繞一圈又是黃捷臨危受命? [討論] 會不會繞一圈又是黃捷臨危受命?](https://i.imgur.com/M2kpO6eb.jpeg)
26
[討論] 賴瑞隆完整回應 有哪段感到抱歉嗎?![[討論] 賴瑞隆完整回應 有哪段感到抱歉嗎? [討論] 賴瑞隆完整回應 有哪段感到抱歉嗎?](https://i.meee.com.tw/ZdRgFxr.jpg)
27
[討論] 台灣禁小紅書、那中國禁什麼?![[討論] 台灣禁小紅書、那中國禁什麼? [討論] 台灣禁小紅書、那中國禁什麼?](https://i.mopix.cc/bcWLSd.jpg)
25
[討論] 中國網友 銳評 台灣禁小紅書![[討論] 中國網友 銳評 台灣禁小紅書 [討論] 中國網友 銳評 台灣禁小紅書](https://i.meee.com.tw/DYOYOwZ.png)
21
[討論] 賴瑞隆連8歲小孩都教不好,還想選市長啊?19
[黑特] 許智傑,保重了![[黑特] 許智傑,保重了 [黑特] 許智傑,保重了](https://i.meee.com.tw/wfH2veX.jpg)
21
[討論] shirman請進,關於高雄市長初選民調19
[黑特] 你有IG為什麼要執著小紅書??![[黑特] 你有IG為什麼要執著小紅書?? [黑特] 你有IG為什麼要執著小紅書??](https://i.imgur.com/BLAPTkwb.jpeg)
20
[討論] 本來是助理的錢 變成了立委的錢!!19
[討論] 投訴賴瑞隆的家長是否有中國背景?5
[討論] 笑死台灣也要學翻牆了![[討論] 笑死台灣也要學翻牆了 [討論] 笑死台灣也要學翻牆了](https://i.imgur.com/9zIgH7Tb.jpeg)
17
[討論] 少了小紅書就生活不能自理的是什麼人?52
Re: [討論] 霸凌案對賴瑞隆一定會重傷![Re: [討論] 霸凌案對賴瑞隆一定會重傷 Re: [討論] 霸凌案對賴瑞隆一定會重傷](https://i.mopix.cc/WmlOPY.jpg)
15
[討論] 「創意私房」 數位部正式封網![[討論] 「創意私房」 數位部正式封網 [討論] 「創意私房」 數位部正式封網](https://i.mopix.cc/8Wxwia.jpg)
9
[討論] 關於小紅書,民進黨失誤了11
[討論] 要談小孩養的怎樣國民黨沒資格![[討論] 要談小孩養的怎樣國民黨沒資格 [討論] 要談小孩養的怎樣國民黨沒資格](https://i.meee.com.tw/C9qYKnP.png)
14
[討論] 邱議瑩vs賴瑞隆,選誰?![[討論] 邱議瑩vs賴瑞隆,選誰? [討論] 邱議瑩vs賴瑞隆,選誰?](https://i.imgur.com/FlkEV9Ob.jpeg)
12
[討論] 高雄可以派空降了吧?8
[討論] 民進黨市議員:8歲小孩要你中天公審?![[討論] 民進黨市議員:8歲小孩要你中天公審? [討論] 民進黨市議員:8歲小孩要你中天公審?](https://i.imgur.com/H4JZ5l7b.jpeg)
8
[討論] 其他小朋友的家長 教育真的很不錯9
[討論] 金門國民黨立委陳玉珍的法律超凡見解7
Re: [新聞] 小紅書2年涉詐1706件!他傻眼「FB僅30天
![[討論] DeepSeek消息的三大誤區 [討論] DeepSeek消息的三大誤區](https://i.imgur.com/hz2gtdNb.jpeg)