Re: [請益] 費半成份股全線崩盤 怎麼辦?
DeepSeek這塊有幾個看法 Training端就等之後瓜出來再吃
在Inference這塊 因為受限於MoE 所有推論成本可以降下來 但需求變高的是用記憶空間和各個node之間的通訊開銷 以及軟體上cpu/gpu的load balance
以deepseek v3來說 600GB+ fp8 需要許多平行運算 這意味通訊瓶頸很重要
因為在切換專家時候 延遲會因此也跟者追加 而記憶體需求開銷也很大
另外一點就是37B Activation是主因讓推論可以成本下降 (不用全部671B來跑)
以h100來算這會讓同樣算力 成本下降10倍以上
但對算力晶片load balance和通訊跟記憶體開銷需求也跟者增大
但對於同樣算力可以提高10倍以上token產出
MoE好處就是更適合特制化的低成本下游任務 不適合泛化場景 所以不能用在機器人
這種場景多變任務上
這就代表 假設Deepseek最後成為低成本主流 這意味還是只有老黃能吃下它
(因為需要昂貴load blance 通訊開銷 高需求vram)
ASIC那邊不適合用在MoE架構 這些低成本就某種意義會解鎖ai產品化
原本之前最大問題就是 現有的模型在Inference產生token的電力成本太貴
如果能讓現有成本下降 這樣才會能直接適用到消費端去
並不是說 提高tokens生產數量/單位算力 就等於減少鏟子賣出
事實上 token數量/單位算力 過低 會造就無法ai模型落地化 反而產子賣不出去
最好的例子就是DeepSpeed (AI Backend 優化) 這玩意一年前 微軟就用它來提高
tokens數量/單位算力 號稱能增加1.5~3倍快同樣算力 結果微軟反而願意花更多錢買算力
這波最大意義大概就是會變動推行MoE架構 然後ASIC死去 QQ 而老黃有NVLink
和壟斷HBM產量 又有良好的cuda為主的AI Backend做load balance 感覺很難輸
說到底 最簡單的觀察就是看1/23微軟財報的資本支出 微軟在01/03說出2025 80B
(Deepseek v3 12/26/2024 模型釋出) 如果01/27資本支出維持原案 那就沒啥太大擔心
--
MoE缺陷:需要把所有專家放入內存 對顯存(VRAM)壓力需求高大 高熬貴通信成本
不利模型泛化性 適合單一任務(畢竟你只用了原本模型部分activation parameter)
※ 引述《keio5566 (56不滅)》之銘言:
: 是不是又是GG的勝利
: 能夠用科技大頭的5%成本就能開發AI
: 意味著行業的進入門檻變低,AI元年正式啟動
: 最高端產品的銷量受影響,但接下來市場要的是便宜堪用的產品
: AMD吃到一波紅利,整體晶片代工需求繼續增加
: 苦的是NV,GG依然贏麻了= =
: 大家恐懼我貪婪
: 2025年抄底GG的最佳時刻是否即將到來?
--
NVDA > AVGO 嗎?
海力士/美光利多
弄HBM的MU還有救嗎
微軟支本支出不太可能有什麼變,時間這麼短
想知道萬潤和法師的看法QQ
其實反而應該是AVGO 的利空...3661 3443...
推 低成本的ai晶片不妙
https://i.imgur.com/1glBeN3.jpeg 說到微軟 剛剛

CEO也發推了 立場很清楚了吧
資本支出不可能短時間修改+1
推推,好人一生平安
前一陣子有炒作一波ASIC 現在通通都要下去
但股價可以短時間劇烈波動
其實更優的成本對軟軟,狗哥,雅麻,詐騙公司都是
長期利好
短期跌一下前期投入根本沒差,祖大少元宇宙虧爛還
不是好好的
然後AIPC 或許可以提早放量
但avgo 股價還未受到衝擊
3661死去
甚至不需要額外NPU去運算了<-這比較極端想法XD
再來就是次級玩家不一定要追GB200、GB300
那怎麼看AMD去搶推論這塊?
99 MU
AVGO可能要等市場開盤之後會比較清楚
現在美國那邊還是27號凌晨
如果是有效率的話 資料中心一定越蓋越多
ASICㄘㄨㄚ、勒蛋
如果DS能這麼低成本達成80%水準,那這些大頭應該是
研究怎麼讓資本支出跟成效比例合理,而不是降低支出
吧,不然這些大頭一堆現金要幹嘛
請問交換器需求的看法?
根據過往Cost down財報噴!股價噴!
能不能COST DOWN 我覺得先看論文 可不可能重現
利多吧 一堆人加入ai反而csp要更多算力租借出去
DS使用類似當初GOOGLE 圍棋那套方式去自我訓練
然後5萬張H100 傳聞也不知道真假XD
不過MoE模型的確是可以有效降低成本 這沒錯
最後變成是賈維斯跟事務型機器人的對決XD
最終目標還是拼出AGI,其他都是過渡
還早,各大廠可以用DSP來提前適應新的推論需求,而
記憶體方面用HBM2E也足夠應付推論需求
DS這套不可能成為AGI,這是提前耗盡潛力的模型
結論:NV 多更多
的確,NV LINK還是優勢,與軟體的平衡。AI基建的需
求還是持續。
推分析 謝謝 我差點想成反的方向
以美股現在來看 感覺是NV AVGO TSM三殺
短線通殺一定的 重點是殺完買誰
年後有殺來買點老黃@@
論文裡就寫alphago那套MCST失敗了,是怎麼看的
第一天看科技股?通常消息出來都先漲/殺,之後再來
澄清再反轉,都懷疑那些資金趁消息出來故意拉/壓股
價作法
殺完整理籌碼繼續往上
可是股價不是這樣反應喔
不過我剛剛請他幫我讀個股報告 說報告內容違反政策
AVGO不止做ASIC 交換器 網通 光通訊都做 就算沒AI A
SCI也是持續成長的東西 AVGO就算這個利空也很難崩跌
畢竟她產業太多樣
殺完如果最終評估不受影響還是噴回來 哪次不是這樣
總覺得華爾街不會亂買再亂殺XD
應該是指完全不依賴人類知識...接近alphazero...
華西街最擅長的就是亂買跟亂殺啊XD

很有趣 可以自己去問看看
認真文 給推 好人
這才是有料的發文 不像那些無腦黑無腦吹的
GPT-4 不也是 MoE? 差在哪裡?

很久以前PTT這種很多..
問題是這篇怪怪的,機器人如果不聯網。
請問憑機器人有限的算力與記憶體 能使用什麼模型?
機器人問題跟自駕系統是一樣的。
感謝好人一生富貴
優質好文。
推
NV盤前7%了?真嘟假嘟
推
NV差不多跌7%沒錯
不過現在還不到盤前時間 是黑池交易所跟券商內部
報價
達人說TSM也快7%了,真的是腥風血雨
今天晚上可以接刀子嗎
TSM -6.57%
HBM只是這幾年的過渡期產品,沒跟上的不需要追高。
講白了 你人類接上網之前怎麼學習的就怎麼學習
不聯網只是比較智障 但你很多工作本來也只需要智障
一堆訓練真的需要聯網嗎 他這模型是在節省訓練&記憶
開盤台積連跌停兩天我就相信
好人推
這種極端工作條件總感覺有免洗軍用衍生的用途
nv出了比avgo還猛的pcie sw才會是avgo利空
讓子彈飛一會兒
記憶體跟SSD不就長江庫存超多,換別的地方還真沒這
條件
Chatgpt meta google Amazon 早晚會下去吧,中國用免
費跟你競爭,怎麼玩下去
我是相信後年b通就會讓老王吃屎
nvlink沒那麼厲害
這重點不是大陸不再受到美國限制嗎…..如果ai可以
自己研發到這程度話~世界就不再是美國說了算歐~
單純討論公司間的影響的話~我覺得意義不大~
誰可以寄信給教主發文 快瘋了
記憶體要HBM吧 長江也有這麼多嗎
99 B康
跌深就是給上車的,趕快開盤
長江有做HBM嗎?我記得沒有吧...
AVGO的ASIC是CSP大廠自研晶片
怎麼可能沒有量?傻傻的
參考了LD大和其他論述、這幾天想一想,推出來了後續
方向也差不多,LD大猛
有我川在.美國AI絕不可能輸的
反倒會激起我川更激烈的管制
LD大後續會布 CRM , SAP (SAAS) / PLTR (特定API)
領域麻,算力成本、選擇變多情況下游,我覺得應該受
惠

2/3日紅盤日,世芯跟台積電開盤跳空跌停鎖死
前面一堆廢文
這篇才是有效討論
ASIC出世AMD遭殃,DS出世ASIC遭殃,99蘇媽
不過deepseek r1 一個禮拜前01/20才出
82
首Po如題 deepseek問題其實很早就知道了 上禮拜看華爾街也沒動作 沒想到現在華爾街發酵都這麼慢 說好的股價領先反應呢![[請益] 費半成份股全線崩盤 怎麼辦? [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/LpAZBufb.jpeg)
爆
是不是又是GG的勝利 能夠用科技大頭的5%成本就能開發AI 意味著行業的進入門檻變低,AI元年正式啟動 最高端產品的銷量受影響,但接下來市場要的是便宜堪用的產品 AMD吃到一波紅利,整體晶片代工需求繼續增加![Re: [請益] 費半成份股全線崩盤 怎麼辦? Re: [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/KuLlUeyb.jpeg)
12
如果deepseek這玩意兒是真貨 那就很像當年 智慧手機廝殺 殺到有人出turnkey一樣 搞得大家都會做 都能出貨 大家都能出貨那就代表毛利會慘![Re: [請益] 費半成份股全線崩盤 怎麼辦? Re: [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/jKDB5DXb.jpeg)
爆
既然有人提推論,我就講看看訓練端 DSv3 論文中最大亮點,可能也是目前看起來崩盤的主要是 $5.77 million 的訓練成本 和他對比的是喇叭哥曾經說 GPT4 花了超過 $100 million 訓練 未公開的 GPT5 據 WSJ 說,每一次六個月訓練週期需要花超過 $500 million 簡單用 GPT-4 : DSv3 = o1 : DSR1 估計 o1,但應該更多啦,不過低估在這邊不重要![Re: [請益] 費半成份股全線崩盤 怎麼辦? Re: [請益] 費半成份股全線崩盤 怎麼辦?](https://i.imgur.com/ZrjivY5b.jpeg)
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響![[心得] DeepSeek對AI產業鏈影響懶人包 [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/WiusWatb.jpg)
爆
Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售你劃錯重點, 先不論這篇論文的可行性與實用性, 你真的劃錯重點了 算力重要嗎? 重要但是不是影響販售/採購晶片的主因,![Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售 Re: [新聞] 輝達H100晶片紓壓了 訂單大戶開始轉售](https://i.imgur.com/GxJuHEib.jpeg)
84
Re: [新聞] 台積電:AI需求噴發 但全球科技業復甦不AI跟5G的類比講真的有點勉強 同樣也跟2000年網路基建的狀況不太一樣 來看一下祖家大少怎麼講的 其實重點並不是AI![Re: [新聞] 台積電:AI需求噴發 但全球科技業復甦不 Re: [新聞] 台積電:AI需求噴發 但全球科技業復甦不](https://scontent-tpe1-1.xx.fbcdn.net/v/t15.5256-10/425379900_1138626150620917_3681624693975397461_n.jpg?stp=dst-jpg_s1000x1200&_nc_cat=108&ccb=1-7&_nc_sid=c26028&_nc_ohc=pX1SbLYEAoEAb6w2Vhb&_nc_ht=scontent-tpe1-1.xx&oh=00_AfDVfKyKhvsyvwxVovczdY2E_7Bb1PGz478GlG0K725mnA&oe=66299A82)
22
[問卦] deepseek超低成本計算是真的嗎?deepseek賣點就是不堆算力 改進算法用少量算力做出很大的成果 不過有人說是唬爛的 財經網美說deepseek偷偷用了五萬顆H100 光這成本就幾千萬美金了![[問卦] deepseek超低成本計算是真的嗎? [問卦] deepseek超低成本計算是真的嗎?](https://i.imgur.com/U7JYqIkb.jpeg)
14
Re: [心得] DeepSeek對AI產業鏈影響懶人包先說結論 NV股票還是會漲啦 這十三年來在這大世代裡各個小世代AI進步頂峰幅度對應精確度 總結下來 因為這世代AI是用猜的 如要減少50%的錯誤 就要提升2的20次方算力 也就是Ai要提升一倍精確度 需要100萬倍的算力 這次DeepSeek只是讓這曲線抖動了一下 算是這個小世代AI算力最佳化的巔峰了![Re: [心得] DeepSeek對AI產業鏈影響懶人包 Re: [心得] DeepSeek對AI產業鏈影響懶人包](https://i.imgur.com/5J84LWDb.jpg)
17
[問卦] AI成本低,所有AI 股票都會下跌吧?是這樣的 現在有個Deepseek AI 大幅度降低AI算力成本 間接證實根本不需要購入一堆增加算力的硬體 即使AMD有介入6
Re: [請益] Deepseek v3 對台積電有影響嗎我覺得評比指標什麼都是後話 使用體驗太差 你看看這樣怎麼稱霸世界呢? 你的進線參數與資料量就比別人少了,![Re: [請益] Deepseek v3 對台積電有影響嗎 Re: [請益] Deepseek v3 對台積電有影響嗎](https://i.meee.com.tw/CafPIov.png)
4
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤算力愈強,模型愈強~ 就算deepseek 真的不用高階晶片就能訓練出說不弱於openAI o1 的模型, 那未來新的模型在有高階晶片的加持下, AI 不是會發展的更快、更難以想像嗎? AI 發展的更快,商用、消費用的領域愈多,對半導體的需求愈大,3
Re: [問卦] AI成本低,所有AI 股票都會下跌吧?算力成本降低 有個東西變成真的能賣 叫做AI PC 現在有很多AI PC 但是沒有真的可以塞進去的模型1
Re: [新聞] DeepSeek爆紅引AI「股瘟」!ASML歐股開盤DeepSeek 終歸是個軟體... 硬體標竿還是硬體標竿阿 DeepSeek 這軟體用中低階硬體來算出 其他軟體用高階設備的算力
爆
[請益] 0056可以這樣操作嗎![[請益] 0056可以這樣操作嗎 [請益] 0056可以這樣操作嗎](https://i.imgur.com/z8X13Bfb.jpg)
83
Re: [心得] 山椒魚盤勢觀察![Re: [心得] 山椒魚盤勢觀察 Re: [心得] 山椒魚盤勢觀察](https://i.mopix.cc/LLOj00.jpg)
54
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
38
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
32
[情報] 2344 華邦電 114年11月營收![[情報] 2344 華邦電 114年11月營收 [情報] 2344 華邦電 114年11月營收](https://i.mopix.cc/JF4BB2.jpg)
25
[情報] 3443 創意 11月營收16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預16
[請益] 第一金最近有什麼大事要發生嗎?13
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多![Re: [標的] 記憶體族群回檔 彎腰撿鑽石多 Re: [標的] 記憶體族群回檔 彎腰撿鑽石多](https://i.imgur.com/MO9jzZjb.gif)
29
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性10
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性22
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐9
[情報] 日本兩年期公債收益率升至1.03%8
[情報] 1205 上市投信買賣超排行5
[情報] 2548 華固 10月營收 MoM 702% YoY 37447%![[情報] 2548 華固 10月營收 MoM 702% YoY 37447% [情報] 2548 華固 10月營收 MoM 702% YoY 37447%](https://i.meee.com.tw/gQ7aplg.png)
Re: [請益] 0056可以這樣操作嗎4
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://i.imgur.com/4uwgTa3b.png)
1
Re: 00641R 富邦日本反1 小單多
[情報] 工紙族群多
[標的] 2454聯發科2330台積電 哪個好![[標的] 2454聯發科2330台積電 哪個好 [標的] 2454聯發科2330台積電 哪個好](https://i.imgur.com/TbK5aJcb.jpeg)
[情報] 114年12月05日 三大法人買賣金額統計表