Re: [新聞] DeepSeek 遇大規模網路攻擊，暫時只支援

chesterhe 發表於 2025/1/29 下午5:26:08

看板Stock標題Re: [新聞] DeepSeek 遇大規模網路攻擊，暫時只支援作者

(chesterhe)時間Jan 29 17:26:08 2025推噓18 推:18 噓:0 →:14

※ 引述《WinNOKIA (海神)》之銘言：
: 1. DeepSeek創辦人梁文鋒，少年股神變AI大神
: 2. 紐約時報指出，DeepSeek是由中國對沖基金幻方量化（High-Flyer）創辦
: 3. DeepSeek 宣稱，訓練成本僅 557.6 萬美元，幾乎是其他科技巨頭大型語言模型的十: 分之一成本，這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看，DeepSeek是什麼狀況，不就很清楚了嗎？

Musk贊同投資公司Atreides Management合夥人兼資訊長貝克（Gavin Baker）在X提到
DeepSeek的R1低成本來自在訓練和推理效率上，取得了真正的算法突破
例如 FP8 訓練、MLA（機器學習加速）和多 token 預測。
訓練過程中涉及大量的知識蒸餾（distillation）
這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下，這項訓練幾乎不可能完成。
並提出質疑對中國限制最先進 GPU 的出口，卻不阻止其蒸餾美國的頂尖 AI 模型
這基本上讓出口限制變得毫無意義
AI 基礎設施領域的現有贏家面臨的最大風險是
兩年內，R1的蒸餾版本可能會在高端智慧型手機上運行
Musk稱AJ will be everywhere.(AJ應為筆誤AI)

總之DeepSeek推出的模型低成本除了技術上突破外，很大基礎是建立在GPT
但在高階GPU管制下，要透過訓練超越OpenAI是不可能的
而且如果之後OpenAI防堵知識蒸餾，連推新版本都有困難
所以吹牛大賽大概也差不多該接近尾聲了
那競爭布局可能為何? GPT給了答案
https://imgur.com/wNCJOYB
「50B AI」指的是一個擁有500億個參數的大型語言模型（LLM）
相當於 GPT-3.5 的規模

另川普於 2025 年 1 月 21 日發布啟動5000 億美元「Stargate」（星際之門）
人工智慧（AI）計畫。參與的公司包括 OpenAI、軟銀和甲骨文。
而 DeepSeek 則於 2025 年 1 月 20 日推出了其新模型「DeepSeek-R1」。
要說巧合也太巧，R1推出目的大概率除了宣示要走向AI設備端，防堵OpenAI壟斷外
就是政治上的大外宣，中國可以用較少資本訓練出競爭級別的AI
甚至影響美國AI產業的投資者信心，改變資本流向

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.71.244.40 (臺灣)

※ PTT 網址

推

tw00172848 01/29 17:28所以要多還是空? 股點是啥

推

Sianan 01/29 17:30不就對岸一貫套路在頂尖科技上跟你有差距但在中

→

Sianan 01/29 17:30低階可以卷死你

推

herculus650201/29 17:32鏟子商笑而不語

→

jo4 01/29 17:33沒gpt就生不出便宜的deepseek 成本都前人扛了

推

gbman 01/29 17:35DS開源就是賣模型!第一天上班XD

→

gbman 01/29 17:36以後GOOGLE應該也要收費被查詢太多次CC

推

fujioqq 01/29 17:36從頭到尾感覺越看越像做空AI股而炒的XD

推

lpmybig 01/29 17:39是啊那模型v2的時候還根本沒人講

推

gbman 01/29 17:41效能被趕上又不是免費!趕快找理由安撫消費者CC

→

Leo4891 01/29 17:41意思就是美國可能會考慮不給你開源了免得你中國

→

Leo4891 01/29 17:41公司都拿去優化

→

gbman 01/29 17:42OPENAI新模型沒開源啊CC

推

fgkor123 01/29 17:43只有不給你用才能防堵，不給用=沒錢錢

→

CCH2022 01/29 17:43做空，低接，大外宣，AI普及往前邁進，各種因素都

→

CCH2022 01/29 17:43有。每個國家都要有主權AI，未來要普及化，持續硬

→

CCH2022 01/29 17:43體建設還是需要。

推

gbman 01/29 17:45美國封開源那應該是世界大笑話CC

推

fgkor123 01/29 17:47阿祖拿詐騙的錢一直開源一直爽

推

NexusPrime 01/29 17:56難怪成本低，建立在別人的基礎上再微調當然快又省

→

NexusPrime 01/29 17:56錢

推

gbman 01/29 17:59一堆都這樣做啊!最先受害的是GOOGLE XD

推

ctx705f 01/29 18:01馬斯克跟貝克？什麼側翼

推

tr920 01/29 18:04其實就先限制像祖克柏這種把LLM最尖端美國技術開源

→

tr920 01/29 18:04的害群之馬就可以了

推

s5656556612301/29 18:09特準備崩爛

推

pideo 01/29 18:21這篇的意思是說，一時蒸餾一時爽，一直蒸餾一直爽

→

pideo 01/29 18:21嗎

推

dongdong040501/29 18:25這樣聽起來GG還是最後的贏家

推

SpursDynasty01/29 18:34AIPC噴？

→

turndown4wat01/29 19:01手機跑得動這個?

短期不可能但趨勢要往這個方向到時可能逼得OpenAI也要賣買斷版的低階AI了

→

sellgd 01/29 21:33你自己生成式AI沒盜用網路上圖文創作?

※ 編輯: chesterhe (61.71.244.40 臺灣), 01/29/2025 23:05:57

同系列文章

Re: [新聞] DeepSeek 遇大規模網路攻擊，暫時只支援

其他人也閱讀了

PTT 熱門相關