Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成
cuda架構長這樣
https://i.imgur.com/Enp8heX.jpeg

PTX就下層driver那部份,基本上還是奠基在NV的GPU上
PTX的操作方法,NV自己都有手冊了
https://docs.nvidia.com/cuda/parallel-thread-execution/
PTX還是nv提供的api,只是進行更底層的硬體操作,速度一定會比透過cuda上層api快
但會很難寫(看手冊就知道)
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.105.176 (臺灣)
※ PTT 網址
推
推你
推
專業
推
推 新聞媒體隨便寫也一堆人信
→
組合語言有幾個人能寫
推
NV的迷宮是走不出去的
→
手刻組語
→
專業
推
專業﹐要命的組語
推
(但會很難寫) 可以用AI寫嗎
推
現在DS就是用自家AI推理模型寫PTX代碼
10
韓國這10幾年強起來不是沒原因的吧 他們看到新東西第一時間是分析他們怎麼做的 台灣第一時間由政府數位相關人士帶頭酸說AI不能談論64沒有用 剛去看覺青,又在崩潰韓國是中共同路人是小中國了 科技歸科技他們是不是做不到阿?2
個人覺得 現在遊戲界也是這樣 nv力推的光追 cuda 加上虛幻5 讓遊戲業者不一定需要15
《轉載》 網路上傳deepseek繞過了輝達cuda,我跟大家講一下deepseek到底做了什麼。 輝達嚴格來說是一個平台性公司,並不止是硬件,硬件只不過是一個載體,它的護城河是cuda計算平台,所有高性能並行計算的祖師爺,只要你用輝達的顯卡做高性能計算,就要透過cuda計算平台。 你說用AMD的顯示卡,嗨,它沒有生態呀,就像android和windows phone那麼大的差別。 你買蘋果手機,不是買的硬體,而是IOS整個生態,這個生態也是用戶黏性的核心,cuda也是如此,你搞高效能運算,週邊的配套生態工具都是cuda的,你總不能自己再開發一套出來,就像你一個開發電商的會去再造個JAVA的輪子嗎? 輝達打來十年的領先時間。 所以各大公司都被英偉達狂宰,有苦難言。 總之一句話,英偉達創造了當代高效能運算的所有標準軟體、硬體以及工俱生態,你想寫個demo用啥都行,你想上生產除了輝達別無選擇,這就是過去十年AI圈的現實 ,天下苦達子久矣。
45
Re: [新聞] Nvidia覇主地位危矣?這些挑戰者做出便小弟請教各位大佬 NV最大的優勢,應該是CUDA CUDA讓各AI專家可以編程NV GPU 讓GPU跑你想跑的東西,而不侷限在圖形運算 AMD正是落後在這裡24
[爆卦] openAI 首席研究員來自台灣Deepseek事件後 OpenAI首席研究Mark chen 出來回應Deepseek Mark chen 2012年畢業於MIT16
[情報] DeepSeek繞過CUDA 自己優化底層編程語言關於DeepSeek的優化改進 許多人沒注意到的是: DeepSeek也繞過了CUDA並使用底層編程語言PTX做優化 在輝達的PTX語言實際編譯流程中23
Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N各位早安, 這裡是禮拜六早上的 R&D。 ※ 引述 《amduser (重返榮耀)》 之銘言: : : 之前新聞![Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N Re: [閒聊]AMD顯卡可以跑CUDA程式,那就不必特地買N](https://img1.mydrivers.com/img/20240216/6afa4966af674a5184f0fadd6f9c5093.png)
15
Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉AI GPU 這塊未來十年內肯定還是 Nvidia 獨大,就跟 台 gg 一樣,整個生態早就建立起來了,要幹翻他光有錢是不夠的 皮衣刀客在十幾年前就佈局 cuda,只要有用 Nvidia gpu 做加速的軟體通通都要綁 cuda,目前開源做深度學習跟推論的,也都是綁 cuda , 然後 cuda 並不是開源的,所以如果不是 Nvidia 的晶片,根本不能用 cuda 所以你看 meta 買 nv 的卡,openai 也買 nv 的卡,AMD 雖然也有自己的運算軟體,但生態系沒建立起來,在 AI 這塊終究看不到 nv 的車尾燈,你有看過有哪家大廠買 AMD 的卡做訓練嗎? 所以搞 gpu 晶片這塊就跟牙膏在 gg 面前說要做先進半導體製程一樣,只是純燒錢而已,什麼都不會有的 -----9
Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉OpenCL真的很難紅得起來 10年前大學時因為修課不得已寫過幾次 完全可以理解為何cuda打遍天下無敵手 現在基本上只有學術產paper時,出於研究性質的一發藝 近來也有很多論文,開始很放心地玩PTX (CUDA的bytecode)![Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉 Re: [新聞] 中國AI晶片業陷困境 兩大關鍵廠商消沉](https://img.youtube.com/vi/um8xqvVwxMA/mqdefault.jpg)
X
Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?剛剛看到最新分析 跳過 CUDA,Deepseek 用精細的 PTX 寫成 韓國大宇未來資產的分析報告指出,Deepseek 並未使用 Nvidia 的 CUDA 編寫,而是透過 大量精密調整的併行線程執行代碼,達成採用較低規格的硬體產出高效能 AI 模型表現。 所以他不用cuda![Re: [討論] 藍白為什麼連蹭Deepseek都能翻車? Re: [討論] 藍白為什麼連蹭Deepseek都能翻車?](https://i.imgur.com/rcylSPZb.png)
6
[情報] i皇6代以上內顯開CUDA加速 最高buff 52%本來想轉xf的 但我真的看不懂他真的在寫三小(抑或是說源頭cnbeta真的不知道寫什麼) 英文原文: 原作者Github:![[情報] i皇6代以上內顯開CUDA加速 最高buff 52% [情報] i皇6代以上內顯開CUDA加速 最高buff 52%](https://i.imgur.com/7QJsd9ob.jpg)
2
Re: [問卦] 我後悔十幾年前沒買輝達你講的這個叫GPGPU GPU原本是用來做圖形加速的 GPGPU的GP指的是General Purpose CUDA從2006開始 但是GPGPU的概念在2000年前就有 當時CUDA其實還有一拖拉庫的競爭者 這包含了微軟、AMD還有一堆OpenSource專案