Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到
DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破
例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。
訓練過程中涉及大量的知識蒸餾(distillation)
這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。
並提出質疑對中國限制最先進 GPU 的出口,卻不阻止其蒸餾美國的頂尖 AI 模型
這基本上讓出口限制變得毫無意義
AI 基礎設施領域的現有贏家面臨的最大風險是
兩年內,R1的蒸餾版本可能會在高端智慧型手機上運行
Musk稱AJ will be everywhere.(AJ應為筆誤AI)
總之DeepSeek推出的模型低成本除了技術上突破外,很大基礎是建立在GPT
但在高階GPU管制下,要透過訓練超越OpenAI是不可能的
而且如果之後OpenAI防堵知識蒸餾,連推新版本都有困難
所以吹牛大賽大概也差不多該接近尾聲了
那競爭布局可能為何? GPT給了答案
https://imgur.com/wNCJOYB
「50B AI」指的是一個擁有500億個參數的大型語言模型(LLM)
相當於 GPT-3.5 的規模
另川普於 2025 年 1 月 21 日發布啟動5000 億美元「Stargate」(星際之門)
人工智慧(AI)計畫。參與的公司包括 OpenAI、軟銀 和 甲骨文。
而 DeepSeek 則於 2025 年 1 月 20 日推出了其新模型 「DeepSeek-R1」。
要說巧合也太巧,R1推出目的大概率除了宣示要走向AI設備端,防堵OpenAI壟斷外
就是政治上的大外宣,中國可以用較少資本訓練出競爭級別的AI
甚至影響美國AI產業的投資者信心,改變資本流向
--
所以要多還是空? 股點是啥
不就對岸一貫套路 在頂尖科技上跟你有差距 但在中
低階可以卷死你
鏟子商笑而不語
沒gpt就生不出便宜的deepseek 成本都前人扛了
DS開源就是賣模型!第一天上班XD
以後GOOGLE應該也要收費被查詢太多次CC
從頭到尾感覺越看越像做空AI股而炒的XD
是啊 那模型v2的時候還根本沒人講
效能被趕上又不是免費!趕快找理由安撫消費者CC
意思就是美國可能會考慮不給你開源了 免得你中國
公司都拿去優化
OPENAI新模型沒開源啊CC
只有不給你用才能防堵,不給用=沒錢錢
做空,低接,大外宣,AI普及往前邁進,各種因素都
有。每個國家都要有主權AI,未來要普及化,持續硬
體建設還是需要。
美國封開源那應該是世界大笑話CC
阿祖拿詐騙的錢一直開源一直爽
難怪成本低,建立在別人的基礎上再微調當然快又省
錢
一堆都這樣做啊!最先受害的是GOOGLE XD
馬斯克跟貝克?什麼側翼
其實就先限制像祖克柏這種把LLM最尖端美國技術開源
的害群之馬就可以了
特準備崩爛
這篇的意思是說,一時蒸餾一時爽,一直蒸餾一直爽
嗎
這樣聽起來GG還是最後的贏家
AIPC噴?
手機跑得動這個?
短期不可能 但趨勢要往這個方向 到時可能逼得OpenAI也要賣買斷版的低階AI了
你自己生成式AI沒盜用網路上圖文創作?
爆
1. DeepSeek創辦人梁文鋒,少年股神變AI大神 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?48
十 : 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。 : 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎? 來看看大神Andrej Karpathy是怎麼評論的 Andrej Karpathy13
看了DS的討論,我反而覺得有些商機 1.DS訓練成本是低,只有557萬美金,但訓練要快兩個月。如果稍微多花一點錢,租高階GPU來跑,那是不是可以接受?反正增加兩三倍成本也不貴。 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好,搶市場也很重要。 3.這557萬美金是訓練成本,真要運作不可能只會這樣,那會崩潰。尤其使用者暴增的時候。所以市場普及硬體需求不會上升嗎?那是不是硬體相關股票反而可以增持? 4.會不會出租GPU也變很大的商機?所以可以買相關持股,或是自己買來租?7
階G : 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好 , : 3.這557萬美金是訓練成本,真要運作不可能只會這樣,那會崩潰。尤其使用者暴增的 時?
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。30
[情報] 馮驥:DeepSeek是國運級的科技成果大推DeepSeek 「黑悟空」製作人:國運級別的科技成果 中國大陸AI新創公司DeepSeek發表的DeepSeek-V3及DeepSeek-R1兩款大模型近期受到大量關 注,連《黑神話:悟空》的製作人馮驥也發文大力推薦,甚至稱DeepSeek可能是「國運級別 的科技成果」。29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了21
[閒聊] 串連數千個 Nvidia GPU,微軟打造 Chattechnews 串連數千個 Nvidia GPU,微軟打造 ChatGPT 的超級電腦 March 14, 2023 by 陳 冠榮 微軟斥資數億美元打造一台大型超級電腦,串連數千個 Nvidia GPU,為 OpenAI 的聊天機10
[問卦] deepseek會刺破ai泡沫嗎?原來訓練ai並沒有那麼昂貴, 中國Deepseek 公司用低成本就能訓練媲美OpenAI的gpt 中國低價策略根本讓高成本美國巨頭無法招架 Deepseek 會刺破ai泡沫嗎?有台積股票的會顫抖嗎? 有卦?6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI1
[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣剛看了DeepSeek R1原始文件 Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv preprint arXiv:2501.12948. 看完結論就是X
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習
96
[標的] 聯發科 空74
[情報] 3481群創 股東會紀念品:白米一公斤38
[請益] 台灣貿易順差超大 但為何台幣貶成這樣?41
[心得] 資料中心投資方向17
[情報] 3189景碩 113EPS 0.11(Q4 -0.55) 股利118
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 418
[情報] 2942京站 獨董彭振聲 因個人生涯規劃辭任73
[情報] 0217 上市外資買賣超排行19
Re: [新聞] 營收衰退10.72% 台旅館業憂倒閉潮12
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 4爆
[標的] 大盤 空26
Re: [標的] TYO 7803 武士道無腦多X
[標的] 台指期 多8
[情報] 00946 114/03/06 預估除息0.025元47
[心得] 哲哲: 以後滿街自駕車 台股今年260007
[心得] 券商app年度回顧21
Re: [新聞] 輝達GB200出貨量遭爆砍3成 一掛AI伺服器4
[情報] 8028 昇陽半導體1月自結0.431X
Re: [新聞] 遭聯電切割「已非榮譽董事長」曹興誠回應20
Re: [請益] 台積電被勒索救Intel 沒有涉嫌背信罪喔8
Re: [新聞] 三大國營事業去年虧損 水電油價都要檢討56
[情報] 114年02月17日 三大法人買賣金額統計表4
Re: [請益] 戰爭時的資產安排16
Re: [新聞] DeepSeek推動1.3兆美元回流中國股市 大18
[情報] 0217 上市投信買賣超排行X
Re: [新聞] 環狀線災損雙北求償逾19億 中工:鑑定單位黑X
Re: [請益] 戰爭時的資產安排