PTT推薦

Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成

看板Gossiping標題Re: [新聞] 跳過 CUDA,Deepseek 用精細的 PTX 寫成作者
a1e
(我上了賊船了囧)
時間推噓 7 推:7 噓:0 →:3

cuda架構長這樣
https://i.imgur.com/Enp8heX.jpeg

圖 跳過 CUDA,Deepseek 用精細的 PTX 寫成
一般人都是用上層土黃色那部份的cuda api來寫ai程式
PTX就下層driver那部份,基本上還是奠基在NV的GPU上
PTX的操作方法,NV自己都有手冊了
https://docs.nvidia.com/cuda/parallel-thread-execution/

PTX還是nv提供的api,只是進行更底層的硬體操作,速度一定會比透過cuda上層api快
但會很難寫(看手冊就知道)

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.105.176 (臺灣)
PTT 網址

ruokcnn 01/30 17:46推你

neil0611 01/30 17:53專業

rrrr01012 01/30 17:55推 新聞媒體隨便寫也一堆人信

Paulsic 01/30 17:57組合語言有幾個人能寫

mamorui 01/30 18:00NV的迷宮是走不出去的

asiaking5566 01/30 18:01手刻組語

jeangodard 01/30 18:09專業

silveryfox99 01/30 18:12專業﹐要命的組語

jma306 01/30 18:40(但會很難寫) 可以用AI寫嗎

s213092921 01/31 14:43現在DS就是用自家AI推理模型寫PTX代碼