Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子

zxwxz 發表於 2025/1/28 上午2:00:45

看板Stock標題Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子作者

(zxwxz)時間Jan 28 02:00:45 2025推噓11 推:11 噓:0 →:18

DeepSeek其實真正的創新在model的高效設計，其真正的關鍵在efficient MOE還有MLA設計這其實是2024年初DeepSeek V2就發表的東西
R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應

我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應，所以第二個推理模型反而是中國公司出圈了，推理模型的Test Time Compute對模型效率的敏感性就非常強烈了，訓練中大概會涵蓋超大量的推理成本，成本降低25倍相當於研發加速25倍，我想這是OpenAI沒預料到的，現在應該很後悔公開Reasoning 的concept

我必須說AI HW相關廠商個股近期會被嚴重打折
華爾街是很現實的，短期內一定被認定供過於求
至少要等到下階段Agent有顯著實用性才會拉回

美國AI公司應該被嚇到，中國人cost down到極致又免費開源，雲端廠商應該會減緩硬體採購，但其他大模型發展的公司會double down下去，因為成本降低表示應用會更快成型

要知道，這設計已經公開，大家都可以照做，所以應用端會更快有進展，而且是Transformer 架構的優化，各種應用都會吃到將本增效的成果

長遠來說，中美競爭的槍聲響起
模型還是會一直長大
要跑完整版R1至少還是要10張H100
且R1的論文有說，大模型做RL再Distill
比小模型做RL有效的多，所以要突破智力上限，模型還是會越擴越大，但更大的模型應該就有更多降本增效的設計機會

※ 引述《LaLFGF》之銘言：
: 標題: Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子
: 時間: Tue Jan 28 01:08:51 2025
: 　
: 　
: 想太多了
: deepseek是一個成本大降幅下降的gpt
: 現在好像氣勢很旺似乎帶給gpt極大的威脅也讓nvda、tsm一起下去
: 但這只是投資者、投機者的視角跟驚恐過度反應
: 　
: deepseek除了成本下降性能也跟著閹割
: 回頭看一下還沒被閹割的現況gpt
: 日常有在中、重度以上gpt的人都不難知道
: 它的回覆有時候都可以讓user氣到想吐血了
: 完整版的都尚且如此了更何況是閹割版的東西
: 　
: user包容gpt的百般錯誤是因為在90%時機可以帶來便利只得容忍10%腦殘
: 但當使用閹割版導致錯誤腦殘變成20%機率出現時
: 那還真的是與其省那預算不如乾脆不用
: 　
: 自動化與AI的應用絕對是以正確性為唯一出路
: 閹割版只有死路一條
: 　
: 　
: 　
: ※ 引述《steven961302 (阿哲)》之銘言：
: : 從DeepSeek騰空出世，在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺，這輪的: 科技
: : 股估值修正才正剛開始，誰能引爆華爾街炒作了整整一年的AI神話泡泡？或許DeepSeek: 就會
: : 是刺破本輪AI泡沫的那根釘子。
: : 記得2021 Nvidia顯卡被炒作的神話嗎？那時候以太幣漲到一顆4500，NV的RTX3060顯卡: 從24
: : 99美元被炒作到6000美元以上，後來的故事大家都知道了，隨著2022那輪幣圈的泡沫暴: 跌跟
: : 以太幣改為質押共識制，挖礦無利可圖，NV的顯卡在市場上直接暴跌，那些礦場大量的: 顯卡
: : 甚至有打一折賣出的，NV的市值也從巔峰的340跌到100，將近70%的跌幅，然而2023年: 的這
: : 波AI浪潮又讓算力的需求增加，NVDA無疑是這波賣鏟子中風口上最大的贏家，憑藉著市: 場獨
: : 有的高階算力，股價整整翻了10倍。
: : NV之所以享有那麼高的估值，那就是AI浪潮暴發以來，美國這些科技巨頭走的就是依靠: 硬體
: : 算力來提升AI的路線，而NV恰好壟斷了所以的高階算力硬體，所有的AI公司必須找NV購: 買硬
: : 體，囤GPU，這就導致了NV的股價飆升，美國目前正利用政策等壟斷高階算力硬體的方: 式來
: : 實現稱霸AI產業的目標，我們可以看到在這過程中，中國無疑是被排斥在外的，從2021: 以來
: : 的各種的禁令也無疑是針對中國的。
: : 但Deepseek的出現，如果能證明「以優化算法搭配中低端硬體+少量高端硬體」的路線: 是可
: : 行的，那麼美國自身的AI公司及其投資者，是不是會停止花那麼多錢來堆積高端算力硬: 體？
: : 這是否跟當年囤顯卡挖礦的場景有同樣的既視感？
: : 假如NVDA市值的支撐是建立在高端算力硬體的壟斷上，那Deepseek 的影響就是巨大的: ，代
: : 表市場根本不需要那麼多高端算力的GPU，這是徹底的Overbooking，包含其關聯的的供: 應鏈
: : 公司都要遭到市場的本益比重新估值了。
: : NVDA -14%
: : TSM -13%
: : AMD -6%
: : AVGO -15%
: 　
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.44.27 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Stock/E.bD_S5aZ4EP-U
: 推 joggingwang : 重點是老美一直要封鎖老共，但老共一家幻方還是囤了 01/28 01:11: → joggingwang : 5萬片NV晶片，不就打臉老美過去2年的政策失敗 01/28 01:11: → chasegirl : 急了 01/28 01:11: → qazsd : 聯想到一隻常當機出錯的手機或App，你會想用嗎 01/28 01:11: → dferww55 : 而且還超級卡 01/28 01:11: 推 ragochen : NFLXdeepseek的性能閹割到比肩o1? 01/28 01:11: 推 soome : 這只是剛開始，不知道後面中國會卷出什麼東西 01/28 01:12: 推 joggingwang : 一家幻方可以透過轉手買這麼多片，NV跟GG最好都不 01/28 01:12: → joggingwang : 知，為了錢，商人無祖國，接下來就看川哥會不會對這 01/28 01:12: → joggingwang : 2家下更重的禁令 01/28 01:12: 推 CaTkinGG : 沒關係開源後全世界會幫它弄得更好 01/28 01:13: 噓 KISS1979 : 中吹者又在幻想了台灣數位部還沒出手咧 01/28 01:14: 推 Lebrono : 不就一堆重課大佬買了一堆頂裝結果發現只比一個平 01/28 01:16: → Lebrono : 民微課強一點點的崩潰感 01/28 01:16: → shomingchang: 重點就不是deepseek好不好用是可能可以用更少資源 01/28 01:17: 推 yoshian886 : 蒸餾出來的東西也達不到AGI,還是參數再多其實也達 01/28 01:18: → yoshian886 : 不到呢？ 01/28 01:18: 噓 speedman : 還在閹割版 01/28 01:18: → zer0319 : 開源了你可以自己練啊 01/28 01:19: 噓 s1612316 : 那是你個人的感受所有人都要最強最完整的版本？ 01/28 01:19: 推 ksjr : 下禁令的話又要跌了 01/28 01:19: → sa87a16 : 到現在還搞不清楚狀況 01/28 01:20: 推 ImHoluCan : 短空長多，美股不能看空 01/28 01:20: → s1612316 : 卡頓手機整個印度幾億支你說呢？ 01/28 01:20: 推 bior1234 : 就是閹割版啊，MoE模型就是將模型能力線索到特定領 01/28 01:20: → bior1234 : 域，追求在特定領域達到跟你接近的效能，跳脫專家 01/28 01:20: → bior1234 : 領域就打回原形了 01/28 01:20: → sa87a16 : 用最小成本能獨立訓練出來而且有一定成果你不用？ 01/28 01:21: → sa87a16 : 那你肯定NV買到150的天才 01/28 01:21: 推 prestigejoM : https://i.imgur.com/eb9BUsn.jpeg 01/28 01:21

: 推 supereva : 以股價來說的確是泡沫啦但我反而更期待的是應用 01/28 01:23: → supereva : 的加速自動駕駛和機器人會更早實現如果真的強 01/28 01:23: → supereva : 50倍的話 01/28 01:23: 噓 sa87a16 : 準確度能訓練，現在是模型被屌打了，現在還搞不清 01/28 01:23: → sa87a16 : 狀況 01/28 01:23: → heavensun : 必然的阿晶片用比較便宜性能必然弱 01/28 01:23

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)

※ PTT 網址

推

CaTkinGG 01/28 02:07泡沫的是硬體廠不是AI本身

→

zxwxz 01/28 02:21短空長多，不是真泡沫，大模型的優勢還在，重點是

→

zxwxz 01/28 02:21更高效的大模型，可以把尺度推得更大

推

Carloslin 01/28 02:22半導體業大概要跌一陣子了

推