Re: [新聞] DeepSeek傳偷用5萬顆輝達H100晶片
如題
就是純來黑的
看了一下被採訪的人 美國亞裔不意外香蕉人
美國這些搞生成式ai的就是被看破手腳
尤其是那個奧特曼 就是來純搞錢的
直接看deepseek內部人員 截了三點
在去年五月的deepseekv2推出時
在知乎的回答
——————-
羅福莉
DeepSeek
- 親自答 此回答由問題相關方親自撰寫
今天忙飛,深夜,簡單寫幾點:
1. 單論 DeepSeek-V2 模型*的中文水平(來自 20 多個微信群用戶反饋),是真實處在國內外閉源模型的第一梯隊(GPT4、文心 4.0*等),因為沒做 RAG(檢索增強*)等功能,所以實際在官網(@deepseek.com)的體感可能略微沒那麼驚艷,但這不妨礙 API 效果哦!外加 1 元 / 百萬輸入 Tokens 的價格,只有 GPT4 價格的 1/100,性價比之王!
2. 怎麼兼顧模型效果和成本的?基本純靠:模型結構創新(MLA+DeepSeekMoE)+ 超強Infra。MLA妙就妙在,它既是 training efficient MQA,也是 inference efficient MHA。從今天起,放棄MHA/GQA,全面擁抱MLA吧。同時,不嚴謹來說,DeepSeekMoE也算是開啟了“共享expert+細粒度expert分割”的sparse框架風 -- 完全不同於Mixtral MoE的做
法。簡而言之:創新力就是第一生產力!
4. 未來還會持續給大家帶來更驚豔的開源模型(希望有機會可以「明目張膽」地說超過了GPT4-Turbo),所以大家不用擔心模型斷更,也不用擔心API漲價(目前就是大規模服務的價格,不虧本,利潤率超50%)。
。
——————-
去年五月就說了 自己純靠模型創新
就你那幫美國人山姆奧特曼只想搞錢
之前還想騙台積電蓋七兆鎂工廠
Deepseek這樣都沒虧本了
https://i.imgur.com/njL6sdD.jpeg
![圖 DeepSeek傳偷用5萬顆輝達H100晶片](https://i.imgur.com/njL6sdD.jpeg?e=1738290736&s=8tFdCWVtfIsFWGqChnaLQw)
難怪美國這幫搞生成ai的人
真的慌了 封鎖中國硬體
逼迫中國在軟體上搞創新 要來搶飯碗了
生於憂患 死於安樂
--
推整理,講得很清楚
謝謝美國爸爸揠苗助長
這什麼ID
別說那麼多,我要看實測
![圖 DeepSeek傳偷用5萬顆輝達H100晶片](https://i.imgur.com/U9JDfuA.jpeg?e=1738286493&s=JYFtxdUgzsLXinfBMY2byg)
仇中的會看不進去
這樣投資人被騙嗎XD
美國爽死吧,中國去卷軟體,開源處理美國照抄
那個男人可以來穩定軍心一下嗎 a十個0消失好久了
我不仇中,我只是要看實測對比
七傷拳 把算力弄成白菜價 只是讓美國無法商業化而已
支那自吹的文章就不用貼過來了
deepseek 在手機就可以下載來玩了啊
離 GPT 還遠的勒..
蠢投資人就是會信你這套才賠死
羅福莉本人在知乎的回答
老謝救命啊
文如其帳
10億個腦袋,只要出個ㄧ萬個AI天才,建構的模型演
算法邏輯上絕對比老美強,這google前ceo就有預言了
。
葬送的福利連
中國人說純靠模型創新你就信,蠻搞笑的
羅福利是誰?很屌嗎
路人帳號講的你也信喔
那怎麼印度還沒飛天 人比中國還多
過去12hr出來的技術文章 美國人發台灣人發 都說技
術確實很有料 只剩ptt部分鄉民還在民智未開 好好笑
應讓每個人都用得起AI
讓子彈飛一下
看完資料 感覺沒料 硬要吹...
真的超強 太猛了
美股台股提前熊市今年是陸港股起漲點上看一萬
壓低AI價格 就當贏了 根本沒考慮能不能用
不要在嚇剛買老美市值型ETF的韭菜了!!讓人過年好嗎
的確不能用。但是已經能夠讓股價跌10%了
印度現在科研進步的很快喔,Nature Index 目前排世
界第九,碾壓台灣,這兩年提升的幅度很明顯
![圖 DeepSeek傳偷用5萬顆輝達H100晶片](https://i.imgur.com/EeIfhC4.png?e=1738319652&s=4Ry1U_91GwecXPfBhndQ1A)
或許在跌管制破口要被封?
中國在廿年前也是一片科研沙漠,和台灣差不多甚至
更糟,
;中國科研大約是在七八年前開始快速起飛,現在頂尖
科學和工程期刊很明顯就是美中爭霸的局面
葬送的福利羅
印度的人口是跟中國比 怎麼還輸
一堆這幾年沒賺到錢的中吹都浮上來透氣惹
反觀台灣還在點麵線 可憐
台灣你看跟老黃合照的那批人全都老人你還期待什麼?
人口多、生活環境改善、國家願意砸大錢發展科技,
科學和工程水準本來就會提升,差在成長曲線而已。
中國人絕對不笨,印度人可能更聰明(但或許比較懶散
?)
ptt本來就是聊天打屁用的 2300萬人的論壇是要多有
水準
ai的東西你一定要看美國論壇
台灣零ai人才 這是一個全新的領域
因為印度科研開始起飛的時間點比中國晚了快十年,
而且兩國政府的有錢程度還是差蠻多的...
沒ai也沒差,沒ptt,dcard,google就慘了
看ptt投資ai 跟看哲哲投資ai 一樣 你會輸光 還輸更
快
ai目前就中美兩強而已
反正沒弄死中國ai,美國應該很幹
這兩年在 ACM STOC, JACM 這種 CS 投稿難度最高的
頂會、頂刊都可以看到來自印度國內大學的論文了,印
度進步的速度也蠻驚人的
台灣AI人才很多好嗎
印度電力設備應該很差,也玩不了吧
印度可能要先改善空汙不然誰敢去
這是來釣魚的嗎XDD
雲端巨頭業者這幾個月會把deepseek的開源碼 能抄的
抄光
這代表 這些雲端業者目前「欲訓練的資料量 ,其所
需的算力,在過去兩年已經預先超標購買50倍」
ai不就是模型多應用少嗎
未來他們的財報很重要 要開始注意會不會砍資本支出
這樣算幫輝達打廣告嗎? 噴爆?
AI應用終究才是有資格成為市值第一的公司 而不是賣
鏟子的
特斯拉終極要成為 市值第一大企業
並且 市值大於蘋果+輝達
台灣「頂尖」的 AI 人才很少 -- 數字會說話,去翻
翻 AI 頂會 NeurIPS, ICML, IJCAI,... 的 Proceedin
gs,來自台灣的論文一直很少,早就是美中兩強爭霸
的局面
科技戰啊 看美國那邊有沒有突然有爆出什麼好料的
台灣頂尖都去美國 不然就在半導體業吧
印度似乎對 AI 比較沒那麼熱衷,他們表現比較亮眼
的是在理論電腦科學等比較抽象思考的 CS 子領域
台灣人不意外
嗯,應該說台灣頂尖的 AI 人才幾乎都去美國了,這
樣的講法比較公平
台灣人就爛,早點被統一統實在,現在那些跑美國的
應該後悔沒去中國了
我的女同學幾乎都在美國 嫁也在美國 生命微生物系
加油,讓我們看看不靠硬體能弄到什麼地步
反觀台灣拿一堆補助卻做出搞笑的東西
統屁啦
![圖 DeepSeek傳偷用5萬顆輝達H100晶片](https://i.imgur.com/LpAZBuf.jpeg?e=1738306613&s=1RM8Hrztwc-5mqybFVKJyQ)
葬送的芙莉蓮
打繁體字的翻牆仔
開源就是給你抄啊 你越抄 就是被控制越深
呵呵 羅福莉也不認識我勸你還是別投資了
去玩刮刮樂算了 呵呵
台灣人短視近利 未來直接被吃掉
成本降低就是能讓更多人進來AI這領域
不封鎖中國也是一樣被超越 晚一點而已
感謝分享
羅福利 95后後,年薪破億。
所以那些吹台積電的現在被打臉很難受阿...之前吹的
硬體...
中國最強了...
記得當初華為mate70出來時,也是說體驗不輸iphone,
就是在說軟體工程的重要性。
所以資本支出?
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片61
Re: [請益] 費半成份股全線崩盤 怎麼辦?DeepSeek這塊有幾個看法 Training端就等之後瓜出來再吃 在Inference這塊 因為受限於MoE 所有推論成本可以降下來 但需求變高的是用記憶空間 和各個node之間的通訊開銷 以及軟體上cpu/gpu的load balance 以deepseek v3來說 600GB+ fp8 需要許多平行運算 這意味通訊瓶頸很重要 因為在切換專家時候 延遲會因此也跟者追加 而記憶體需求開銷也很大43
Re: [新聞] DeepSeek在蘋果中國及美國區免費App下載-現在測試AI大模型的方法其實沒有太明確的標準 甚至有一些謬誤 比如說拿具有時效性的問題去問,像是問現任美國總統是誰 這種時效性高的問題大模型本來就很難回答,除非有讓他連網做結合 應該說,這種問題你應該去GOOGLE就好,不需要問AI18
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模→ strlen : 超英趕美然後呢?有賺錢嗎?啊講到AI不是一堆人最 01/26 18:15 → strlen : 愛拿營利出來講? 01/26 18:15 → strlen : 我就問Deepseek 開源是要賺什麼 作功德喔 01/26 18:15 → strlen : 這東西中性看待就好了 真要精算 這些公司都不能碰 01/26 18:20 → strlen : 只能買輝達台積電 搞AI軟體的沒一家賺過一毛錢 01/26 18:2012
[問卦] Deepseek 不算成功的模型吧問他問題都不回答 請他自省也沒辦法自省 現在的AI模型 一般可以靠著請他再次回答問題 達到提升準確率6
Re: [請益] Deepseek v3 對台積電有影響嗎我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,6
Re: [新聞] 陸企DeepSeek接連推出大模型 陸媒:引發南無阿彌陀佛 敝島上所有做AI的專家學者全部綁在一塊不知道有沒有這家小公司的成就 還不就還好之前有組刻薄的llama救了多少人的論文 讓多少教授只要在那邊跑一跑人家的模型就可以坐穩那個學者的名份 現在又有一個deepseek開源可以伸手直接拿來用6
[問卦] 說AI模型不重要的被打臉了嗎現在美國各大金融新聞 都在報導Deepseek Apple store 上下載量更是超越chatGPT 之前各路AI 大老都表示什麼 AI模型不重要X
[討論] 中國低成本開發出deepseek 台灣還在睡覺?成本超低的A I大模型 甚至以後不需要這麼多顯卡 在那裡吹牛說要蓋大型資料庫的人全部都會哭出來 甚至可能接下來一兩年後顯卡可能會滯銷 Deepseek 完全屌打Open A I
18
Re: [新聞] 去年12月總薪資平均近6.5萬刷新高 金飯15
[情報] 114年02月17日信用交易統計爆
[標的] 聯發科 空7
[心得] DeepReserch: 市值型 > 高股息10
Re: [請益] 台灣貿易順差超大 但為何台幣貶成這樣?7
[情報] 2032 新鋼 達注意標準 1月自結 0.0012
[情報] 00946 114/03/06 預估除息0.025元26
[情報] 3189景碩 113EPS 0.11(Q4 -0.55) 股利14
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 49
[心得] 券商app年度回顧25
[情報] 2942京站 獨董彭振聲 因個人生涯規劃辭任11
[情報] 5864 致和證 113年EPS 1.98 股利 0.4+0.87
[情報] 8028 昇陽半導體1月自結0.431
[情報] 114/02/17 八大公股銀行買賣超排行1
[情報] 0217 上市櫃股票週轉率排行3
Re: [新聞] 川普「對等關稅」預計4月2日上路衝擊歐日1
[情報] 0217 上市櫃外資投信買超金額排行