Re: [新聞] DeepSeek顛覆AI產業模式！曝中國2大發展

dansy 發表於 2025/2/2 下午10:35:43

看板Stock標題Re: [新聞] DeepSeek顛覆AI產業模式！曝中國2大發展作者

(Eye Taiwan)時間Feb 2 22:35:43 2025推噓22 推:24 噓:2 →:50

※ 引述《KIMBEOM (HYYY)》之銘言：
: 原文標題：DeepSeek顛覆AI產業模式！曝中國2大發展方向　ASIC成關鍵
: 原文連結：https://reurl.cc/qn2x9n
: 發布時間：2025/02/02 12:40
: 記者署名：壹蘋新聞網 / 呂承哲
: 原文內容：
: 【記者呂承哲／台北報導】中國AI新創公司DeepSeek近期在科技界掀起熱議，根據調研機: 構TrendForce集邦科技的最新研究，DeepSeek近期接連發表DeepSeek-V3、DeepSeek-R1等: AI模型，將影響終端客戶對AI基礎設施的投資決策。未來，業者可能更注重軟體運算模型: 的效率，以減少對GPU等昂貴硬體的依賴。同時，雲端服務供應商（CSP）可能擴大使用自: 家ASIC（特殊應用積體電路）基礎設施，以降低建置成本。這使得2025年後，市場對GPU: AI晶片及相關半導體的需求可能產生變化。
: 心得/評論：
: 看來ASIC就是未來趨勢 IC設計準備噴噴
: 明天加碼世芯創意 M31

LLM經過這三年發展已展現其潛力，但也陷入(公開)知識枯竭造成的瓶頸
網路爬蟲能抓的都已訓練完
AI模型如還需增加功力，只能望向各家機構(公司)的商業祕密

比如DS團隊使用低階語言PTX來增加GPU計算效率
此部分的知識儲備，據說來自母公司幻化量方過往最佳化量化交易模型的經驗

拿 Python/C/組語/機器語言來比喻就更明瞭
過往程式語言往高階發展，是因為有著訓練人才普及的需求
畢竟組語難學，機器語言就別提了
所以在一個python程式滿天飛的時代，能用C重寫效率優勢就驚人，更不用說使用組語

GPU這塊也是，現在很少有CUDA的使用者會去寫PTX
所以關於"PTX最佳化"公開的知識並不多
但很可能DS團隊已經成功將幻化量方PTX經驗轉換為大模型
然後用在設計下一代大模型的架構上

簡單說就是掌握獨家的低階語言知識，教給AI，然後再"手動迭代"
不斷產生更高效率的低階AI碼農

當然OpenAI內部也有可能擁有類似知識，但效率較低
所以基本可以推論，未來誰越能掌握壓榨硬體的知識，就能持續拉開效率差距

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.41.64.92 (臺灣)

※ PTT 網址

推

arthur52 02/02 22:39可以避開使用CUDA，NV就不再獨大

推

Rattlesnake 02/02 22:44快買a股

推

bj45566 02/02 22:44現今的 compiler 最佳化技術太強大，在很多系統上寫

→

bj45566 02/02 22:44 C 語言執行效率未必會輸給寫組合語言

簡單程式可能效率相當，但稍微複雜點，人力就很難分析驗證整個流程加上組語/機器語言可以控制更底層的元件，特定情況下會存在更高效率方法

推

jacknavarra 02/02 22:44推

推

psee 02/02 22:45PTX是CUDA到機械碼之間的中介碼不可能繞開

→

goodjop 02/02 22:47真的快笑死都是NV的東西要怎麼避? PTT水準的是...

推

hpk89 02/02 22:47存疑，低階語言很有效率沒錯，但系統大到一定程度

→

hpk89 02/02 22:47後很難維護/除錯，你用機器語言寫的出windows 11?

→

hpk89 02/02 22:47 我個人覺得不可能，ds若真的效率比其他model好，

→

hpk89 02/02 22:47應該是算法有進化，不會是用低階語言寫導致的

拿Windows來比太誇張，或許再過30年有機會吧事實上現有LLM的架構很單純，一張圖就能表示清楚只是運算的數量級巨大無比，所以特別適合追求極端的最佳化

推

duriamon 02/02 22:49架構才是重點

推

haunt11 02/02 22:49專業推

※ 編輯: dansy (114.41.64.92 臺灣), 02/02/2025 22:59:53

推

AudiA4Avant 02/02 22:52我記得是用ptx繞過nvlink的限制,但換不同型號就要

→

AudiA4Avant 02/02 22:52重寫

推

jiansu 02/02 22:52最佳化不是全部底層優化是瓶頸用底層加速會用pt

→

jiansu 02/02 22:52x 表示掌握底層換別的硬體架構也只是需要時間而已

→

jiansu 02/02 22:52 cuda ptx不是重點了是他有離開nv生態圈的能力另

→

jiansu 02/02 22:52外不要只關注DeepSeek 模型OpenAI 新模型出來了用

→

jiansu 02/02 22:52戶使用成本也變低了整個ai用戶成本降價時代來臨

推

AdamHuangNew02/02 22:53不懂裝懂

推

jacknavarra 02/02 22:53並不是說DS已完全脫離CUDA 但有機會突破護城河

→

jacknavarra 02/02 22:54他開源給大家摸索, 未來會怎麼發展起來都不好說

→

goodjop 02/02 22:55等有辦法不用NV的產品做出一樣的東西再說

推

bj45566 02/02 22:57(純討論程式語言)回樓上：其實在桌電、筆電這種或以

→

bj45566 02/02 22:57上複雜的環境，人們投入很多精力在改良 C/C++ compi

→

bj45566 02/02 22:57ler，所以用 C/C++ 就很夠了(Windows 11 是用 C++

→

bj45566 02/02 22:57 寫的, Linux 是用 C 寫的) -- 最多就是在少數特定

→

bj45566 02/02 22:57地方夾進一段組合語言

→

kensmile 02/02 22:58使用中階GPU，就能產出高效

→

kensmile 02/02 22:58這點就是優勢

→

goodjop 02/02 22:59我知道你的意思連AMD都沒辦法克服效能衰退問題

→

goodjop 02/02 23:00中國能? AMD還有微軟出錢出人

推

bj45566 02/02 23:01有人應該蠻誤解原 po 的意思 wwww

→

goodjop 02/02 23:04用NV低階程式語言做出較不穩定的ANI要怎麼繞過NV?

→

goodjop 02/02 23:04你解釋看看我哪裡誤解?

→

kensmile 02/02 23:04架構的極致優化和算力需求的精簡，就是Ai的精髓

→

kensmile 02/02 23:04DS做到了

→

kensmile 02/02 23:06讓業界廣泛使用

→

b9513227 02/02 23:06門外漢以為寫程式是電影敲鍵盤亂按喔

→

kensmile 02/02 23:06事實上也是爭相採用

推

bj45566 02/02 23:07AMD 在做的事和 DS 在做的事情又不一樣 =.=

→

kensmile 02/02 23:07台灣軟體界的看法，褒貶不一，但台灣自己搞不出來

→

goodjop 02/02 23:09我只是舉例AMD+微軟都無法取代NV的意思

→

goodjop 02/02 23:10除非 AMD+微軟做出自己的平台

→

kensmile 02/02 23:11openAi準確率也不是100%，DS準確率較低，只要繼續優

→

kensmile 02/02 23:11化

推

bj45566 02/02 23:12微軟在做的事和 DS 在做的事又不一樣 =.=

→

kensmile 02/02 23:12拉高準確率，小而美就是市場主流

→

bj45566 02/02 23:13微軟自己沒什麼在搞 LLM

→

goodjop 02/02 23:15你自己去找資料吧

推

bj45566 02/02 23:16微軟主要合作的 LLM 公司都是用 NV 的硬體架構，含

→

bj45566 02/02 23:16 NVLink 和 NV 認證的 HBM

→

bj45566 02/02 23:16微軟和 NV 根本不是競爭對手的關係

推

neo5277 02/02 23:21樓上正解微軟大概只能算算力掮客

→

bnn 02/02 23:22PTX優化是其中一項但DS還做了其他事情兩件以上

推

Virness 02/02 23:23一樓完全誤解 PTX只是自己寫cuda

推

slothman 02/02 23:48不是都是NV架構嗎要拿什麼繞你當撐竿跳喔

→

followwar 02/02 23:53傻眼..PTX是NV跨架構的膠水語言哪有啥繞過NV==

推

ilovebig99 02/03 00:31難怪open AI會說自己站錯邊，開源真的很猛

推

Brioni 02/03 01:11不是繞過，而是研究NV架構比其他家透徹

→

Brioni 02/03 01:12從開發框架到主要架構都有一定掌握

推

ndilavril 02/03 03:04現在怕的是萬一用低階GPU就可以達到OPEN AI

→

ndilavril 02/03 03:04高階顯卡會有賣不掉的疑慮

噓

bhmagic 02/03 06:06疊帶習大大你字打錯了

噓

mdkn35 02/03 07:43迭代吧？樓上是習大大的秘書？

推

guanting886 02/03 08:27這個就跟某些廠商拼時間魔改java把某些拿掉執行速

→

guanting886 02/03 08:27度一樣但後面新的語言足以做到ex: Rust 公司團隊

→

guanting886 02/03 08:27就重新改寫切過去了不可能再折磨自己用魔改版本維

→

guanting886 02/03 08:27護系統

→

guanting886 02/03 08:29用PTX寫這些東西不要CUDA自己干涉由自己決定所有

→

guanting886 02/03 08:29事這個要考慮團隊經營跟當時時空的環境有什麼條件

→

guanting886 02/03 08:31你往更低階的寫所有條件會更難維護或非常考驗的開

→

guanting886 02/03 08:31發團隊的經驗但真的會變得更窄

→

guanting886 02/03 08:31團隊成員拿翹你就知道問題會變成什麼樣

→

guanting886 02/03 08:33我相信r1能如此成 PTX不會是最大功勞

其他人也閱讀了

PTT 熱門相關