Re: [討論] deepseek不過是中國漢芯事件
我覺得這事情跟硬體已經不一樣了
幾次中國吹出來的硬體 後面證實笑話居多
不過 軟體 中國比較不可能吹出來 這也證明中國很適合在內捲的環境下做研發XD
這次唯一可能會被說嘴的就是到底是用A800還是H100訓練
就等論文上面提到的方法 被其他機構拿去重建試試看就知道了
※ 引述《indium111 (#ttyhg)》之銘言:
: 20幾年前中國發表第一個自製CPU中國漢芯
: 當初一堆人也是說中國半導體要起飛了
: 結果後來被抓包是造假
: 現在又發表個只需要2億就能媲美幾百億開發經費的deepseek
: 這種便宜到接近不可能的東西
: 然後就被人抓包有5萬顆H100晶片
: 我看這個也不過是中國漢芯的翻版
: 不過跟20幾年前不同
: 中國大外宣的實力增加了不少
: 詐騙的本事真得比以前強多了
: 像之前華為手機還真得唬了一陣子
:
--
桃園之光
https://i.imgur.com/ZGzxwgN.jpg
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/ZGzxwgN.jpg?e=1738523227&s=D1EFbYNOxpOIhNjhEywtcA)
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/uoh8K51.jpg?e=1738513363&s=4_43HPGlZORrtuf3AZ7KXw)
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/zgbMzHp.png?e=1738490268&s=ZghVr2SD_nDphC_UsVL_Og)
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/kIwwW5e.png?e=1738485473&s=varLDkdrP-ynulvUO-yH4w)
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/0VNzKh4.png?e=1738483151&s=PlmN-u1B2v7pMrhwiV95WA)
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.181.186.182 (臺灣)
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/TRyENM4.jpg?e=1738524171&s=z8oNmiGwAISqCW9gpyrMxQ)
※ PTT 網址
噓
鴻蒙表示
![圖 deepseek不過是中國漢芯事件](https://i.imgur.com/TRyENM4.jpg?e=1738524171&s=z8oNmiGwAISqCW9gpyrMxQ)
→
還吹? 都有人問這個了~
其實你應該去用perplexity 他已經用DS的模型了 目前為止都還算正常
※ 編輯: MacBookAir12 (175.181.186.182 臺灣), 01/28/2025 16:30:11噓
不是只有這個可以說嘴,而是如果實際上是
→
用大量H100算的,那技術上只是勉強追上Open
→
AI
推
他們在取得大數據會很有利,畢竟中國不要臉
→
,又人多,就算是閹割版又怎樣,到時候真的
→
發現好用一堆人還是會跑去用
推
習大大可能覺得台灣婉君太貴,直接用
→
DS比較划算
→
其實deepseek就是AI界的拚多多 跟ChatGPT目
→
前沒有可比性
→
用差的算力 不精準的AI 租中東的伺服
→
預算 壓到最低 成本確實可以降下來
→
便宜也是一種市場
17
首Po20幾年前中國發表第一個自製CPU中國漢芯 當初一堆人也是說中國半導體要起飛了 結果後來被抓包是造假 現在又發表個只需要2億就能媲美幾百億開發經費的deepseek 這種便宜到接近不可能的東西4
你的邏輯不太對 高度競爭環境下 我丟50塊能賺100塊,你丟10塊能賺一百塊 那我把你的方法學起來 再一樣丟50塊 那不就能賺500塊了嗎6
: 不知真實狀況如何,某種程度上如果是真的其實是好事 但是中國人講話濠洨的歷史斑斑可考 維基有提到漢芯始末,這種連專家都一起參與的造假中國是數一數二
16
[問卦]狂吹DeepSeek結果還是用NV的H100堆出來的?就是阿 版上現在狂吹 DeepSeek 這軟體 結果DeepSeek這軟體 還是用NV輝達的H100晶片堆出來的阿 聽說還用了5萬顆16
[心得] 現階段AI硬體大跌的淺見看遍WSJ、Bloomberg、Barron's各大野雞媒體 基本上現在能確定的事實就是 : Deepseek成本低廉且實力不差 除此之外,是否從此AI產業鏈轉移到軟體、對輝達造成多大衝擊、 甚至是否有偷用H100訓練等,目前都眾說紛紜 尚無定論 小弟覺得決定劇本走向的最終結局,還是得看財報開獎14
[問卦] 大陸已經在AI領域完全超車了吧?大陸自主研發的開源AI DeepSeek 不管是對硬體需求更低的高運算力或是訓練模式, 都吊打洋鬼子的OpenAI 現在連美國的研究人員都要改用DeepSeek來發展AI了 大陸用不到兩年的時間就直接幹爆洋人1
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析如題 我看很多人很急 不知道在急什麼 這次大陸的deepseek證明了幾件事情 首先大陸的軟體實力 不比你美國人差 搞出deepseek的公司叫幻方量化2
[討論] 有一說一 deepseek 話題是為了臭數位部?有一說一 deepseek 話題是為了臭數位部? 三天前 我還不知道 deepseek是三小 只知道AI模型到處是 最有名的就CHATGPT 也知道美國禁賣高階全功能顯卡是為了防中共搞出強大的AI模型出來動搖美國的 科技地位11
Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計 這其實是2024年初DeepSeek V2就發表的東西 R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應 我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中 國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中6
[討論] 八又翻 Deepseek吹出來的據不具名的AI專家指出 Deepseek完全就是吹出來的 因為Deepseek不能問64 因為Deepseek不能問習近平 因為Deepseek不能問中共3
[問卦] 硬體是不是到極限了現在是比拚軟體優化嗎中國版gpt deepseek 更少的硬體 就能達到GPT的效果 說是優化 簡單說就是軟體優化 不是硬體暴力運算 那以後硬體上是不是不需要軍備競賽了1
Re: [問卦] deepseek 只是理由吧安安 下面是小弟逛各大論壇的心得啦 輝達原本H100產出一張賣一張 大家都用原價搶 但現在出了個超低成本的Deepseek
爆
[討論] 你是公務員上班去打牌,扯打牌合法幹小 ?24
[討論] 盧秀燕妳批的假單喔 ? 請假事由:去打牌47
[討論] 青鳥看到新光三越爆炸死人真很開心28
[討論] 鏡週刊公布橘子出境台灣照片38
[討論] 柵欄仔推文一定包含關鍵字的情況好嚴重42
[討論] 劉彥澧沒回應的部分42
[討論] 徐巧芯坦言社會觀感不佳9
[討論] 藍白是不是很沒料22
Re: [討論] 盧秀燕妳批的假單喔 ? 請假事由:去打牌23
[討論] 溫朗東是不是有點猛?20
[討論] 賭博跟幹小三哪一個道德比較高18
[討論] 柯文哲7點半那麼早進辦公室在做什麼?13
[討論] 黃國昌:民進黨搞大罷免搞到灰頭土臉15
[討論] 罷免領銜人算從政嗎?(Y/N?)14
[討論] 有人查賽程是快一個月欸,所以主委很閒13
Re: [討論] 盧秀燕妳批的假單喔 ? 請假事由:去打牌11
[討論] 認真問昌粉真的不會覺得黃國昌很假掰嗎 ?11
[討論] 有外遇不配當罷免領銜人但可以選總統??1
[討論] 為什麼親綠支持者對私德要求低?9
[討論] 台灣工資趕上日本了?9
[討論] 為什麼盧秀燕出事媒體就不報?9
[討論] 最衰的是不是趙天麟3
[討論] 徐巧芯老公怎樣干罷免徐巧芯什事9
[討論] 有外遇該死,那蔣萬安怎麼辦8
Re: [新聞] 快訊/名嘴爆料小三 曹興誠反擊喊告7
[討論] 希望阿北早日去陪柯爸爸9
Re: [討論] 盧秀燕妳批的假單喔 ? 請假事由:去打牌8
[討論] 國昌會怎麼評論台中官員請假跟詐團打牌?7
[討論] 抱怨黃國昌?黃珊珊:蓄意挑撥大可不必8
[討論] 市政重要還是打牌重要?