PTT推薦

Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子

看板Stock標題Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子作者
zxwxz
(zxwxz)
時間推噓11 推:11 噓:0 →:18

DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計這其實是2024年初DeepSeek V2就發表的東西
R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應

我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中大概會涵蓋超大量的推理成本,成本降低25倍相當於研發加速25倍,我想這是OpenAI沒預料到的,現在應該很後悔公開Reasoning 的concept

我必須說AI HW相關廠商個股近期會被嚴重打折
華爾街是很現實的,短期內一定被認定供過於求
至少要等到下階段Agent有顯著實用性才會拉回

美國AI公司應該被嚇到,中國人cost down到極致又免費開源,雲端廠商應該會減緩硬體採購,但其他大模型發展的公司會double down下去,因為成本降低表示應用會更快成型

要知道,這設計已經公開,大家都可以照做,所以應用端會更快有進展,而且是Transformer 架構的優化,各種應用都會吃到將本增效的成果

長遠來說,中美競爭的槍聲響起
模型還是會一直長大
要跑完整版R1至少還是要10張H100
且R1的論文有說,大模型做RL再Distill
比小模型做RL有效的多,所以要突破智力上限,模型還是會越擴越大,但更大的模型應該就有更多降本增效的設計機會



※ 引述 《LaLFGF》 之銘言:
: 標題: Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子
: 時間: Tue Jan 28 01:08:51 2025
:  
:  
: 想太多了
: deepseek是一個成本大降幅下降的gpt
: 現在好像氣勢很旺 似乎帶給gpt極大的威脅 也讓nvda、tsm一起下去
: 但這只是投資者、投機者的視角 跟 驚恐過度反應
:  
: deepseek除了成本下降 性能也跟著閹割
: 回頭看一下還沒被閹割的現況gpt
: 日常有在中、重度以上gpt的人都不難知道
: 它的回覆有時候都可以讓user氣到想吐血了
: 完整版的都尚且如此了 更何況是閹割版的東西
:  
: user包容gpt的百般錯誤 是因為在90%時機可以帶來便利 只得容忍10%腦殘
: 但當使用閹割版導致錯誤腦殘變成20%機率出現時
: 那還真的是 與其省那預算 不如乾脆不用
:  
: 自動化與AI的應用 絕對是以正確性為唯一出路
: 閹割版只有死路一條
:  
:  
:  
: ※ 引述《steven961302 (阿哲)》之銘言:
: : 從DeepSeek騰空出世,在到今天Nvidia (以下簡稱NV) 等一票AI概念股的下殺,這輪的: 科技
: : 股估值修正才正剛開始,誰能引爆華爾街炒作了整整一年的AI神話泡泡?或許DeepSeek: 就會
: : 是刺破本輪AI泡沫的那根釘子。
: : 記得2021 Nvidia顯卡被炒作的神話嗎?那時候以太幣漲到一顆4500,NV的RTX3060顯卡: 從24
: : 99美元被炒作到6000美元以上,後來的故事大家都知道了,隨著2022那輪幣圈的泡沫暴: 跌跟
: : 以太幣改為質押共識制,挖礦無利可圖,NV的顯卡在市場上直接暴跌,那些礦場大量的: 顯卡
: : 甚至有打一折賣出的,NV的市值也從巔峰的340跌到100,將近70%的跌幅,然而2023年: 的這
: : 波AI浪潮又讓算力的需求增加,NVDA無疑是這波賣鏟子中風口上最大的贏家,憑藉著市: 場獨
: : 有的高階算力,股價整整翻了10倍。
: : NV之所以享有那麼高的估值,那就是AI浪潮暴發以來,美國這些科技巨頭走的就是依靠: 硬體
: : 算力來提升AI的路線,而NV恰好壟斷了所以的高階算力硬體,所有的AI公司必須找NV購: 買硬
: : 體,囤GPU,這就導致了NV的股價飆升,美國目前正利用政策等壟斷高階算力硬體的方: 式來
: : 實現稱霸AI產業的目標,我們可以看到在這過程中,中國無疑是被排斥在外的,從2021: 以來
: : 的各種的禁令也無疑是針對中國的。
: : 但Deepseek的出現,如果能證明「以優化算法搭配中低端硬體+少量高端硬體」的路線: 是可
: : 行的,那麼美國自身的AI公司及其投資者,是不是會停止花那麼多錢來堆積高端算力硬: 體?
: : 這是否跟當年囤顯卡挖礦的場景有同樣的既視感?
: : 假如NVDA市值的支撐是建立在高端算力硬體的壟斷上,那Deepseek 的影響就是巨大的: ,代
: : 表市場根本不需要那麼多高端算力的GPU,這是徹底的Overbooking,包含其關聯的的供: 應鏈
: : 公司都要遭到市場的本益比重新估值了。
: : NVDA -14%
: : TSM -13%
: : AMD -6%
: : AVGO -15%
:  
: --
: ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.195.44.27 (臺灣)
: ※ 文章網址: https://www.ptt.cc/Stock/E.bD_S5aZ4EP-U
: 推 joggingwang : 重點是老美一直要封鎖老共,但老共一家幻方還是囤了 01/28 01:11: → joggingwang : 5萬片NV晶片,不就打臉老美過去2年的政策失敗 01/28 01:11: → chasegirl : 急了 01/28 01:11: → qazsd : 聯想到一隻常當機出錯的手機或App,你會想用嗎 01/28 01:11: → dferww55 : 而且還超級卡 01/28 01:11: 推 ragochen : NFLXdeepseek的性能閹割到比肩o1? 01/28 01:11: 推 soome : 這只是剛開始,不知道後面中國會卷出什麼東西 01/28 01:12: 推 joggingwang : 一家幻方可以透過轉手買這麼多片,NV跟GG最好都不 01/28 01:12: → joggingwang : 知,為了錢,商人無祖國,接下來就看川哥會不會對這 01/28 01:12: → joggingwang : 2家下更重的禁令 01/28 01:12: 推 CaTkinGG : 沒關係 開源後全世界會幫它弄得更好 01/28 01:13: 噓 KISS1979 : 中吹者又在幻想了 台灣數位部還沒出手咧 01/28 01:14: 推 Lebrono : 不就一堆重課大佬買了一堆頂裝 結果發現只比一個平 01/28 01:16: → Lebrono : 民微課強一點點的崩潰感 01/28 01:16: → shomingchang: 重點就不是deepseek好不好用 是可能可以用更少資源 01/28 01:17: 推 yoshian886 : 蒸餾出來的東西也達不到AGI,還是參數再多其實也達 01/28 01:18: → yoshian886 : 不到呢? 01/28 01:18: 噓 speedman : 還在閹割版 01/28 01:18: → zer0319 : 開源了你可以自己練啊 01/28 01:19: 噓 s1612316 : 那是你個人的感受 所有人都要最強最完整的版本? 01/28 01:19: 推 ksjr : 下禁令的話又要跌了 01/28 01:19: → sa87a16 : 到現在還搞不清楚狀況 01/28 01:20: 推 ImHoluCan : 短空長多,美股不能看空 01/28 01:20: → s1612316 : 卡頓手機整個印度幾億支 你說呢? 01/28 01:20: 推 bior1234 : 就是閹割版啊,MoE模型就是將模型能力線索到特定領 01/28 01:20: → bior1234 : 域,追求在特定領域達到跟你接近的效能,跳脫專家 01/28 01:20: → bior1234 : 領域就打回原形了 01/28 01:20: → sa87a16 : 用最小成本能獨立訓練出來而且有一定成果你不用? 01/28 01:21: → sa87a16 : 那你肯定NV買到150的天才 01/28 01:21: 推 prestigejoM : https://i.imgur.com/eb9BUsn.jpeg 01/28 01:21

圖 DeepSeek將是刺破本輪泡沫的那根釘子
: 推 supereva : 以股價來說的確是泡沫啦 但我反而更期待的是應用 01/28 01:23: → supereva : 的加速 自動駕駛和機器人會更早實現 如果真的強 01/28 01:23: → supereva : 50倍的話 01/28 01:23: 噓 sa87a16 : 準確度能訓練,現在是模型被屌打了,現在還搞不清 01/28 01:23: → sa87a16 : 狀況 01/28 01:23: → heavensun : 必然的阿 晶片用比較便宜 性能必然弱 01/28 01:23

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.112.255 (臺灣)
PTT 網址

CaTkinGG 01/28 02:07泡沫的是硬體廠不是AI本身

zxwxz 01/28 02:21短空長多,不是真泡沫,大模型的優勢還在,重點是

zxwxz 01/28 02:21更高效的大模型,可以把尺度推得更大

Carloslin 01/28 02:22半導體業大概要跌一陣子了

DLHZ 01/28 02:27正解

crowley 01/28 02:30推這篇

fitenessboyz01/28 02:34只能說應用大戰的時代加速來臨

baddaddy 01/28 02:35

fake 01/28 02:55當初開源的時侯就應該想得到會有更強大的的對手出

fake 01/28 02:55現了吧 對於熱愛技術的人來說ds的出現應該是讓他們

fake 01/28 02:55興奮而不是煩惱?

fake 01/28 02:56同樣的DS也是開源應該也是基於此理由 應該吧

fake 01/28 02:57他們追求的是全世界的人才一起發展AI而不是商業壁

fake 01/28 02:57

kobe760903 01/28 03:16現在是有投資的在煩惱…

bj45566 01/28 03:32對於技術宅和科研宅來說 DS 的出現本來就讓他們更

bj45566 01/28 03:32興奮,去 Reddit 看英文討論就知道什麼是專業 --

bj45566 01/28 03:32 反而 PTT 最熱門的反應是:DS 純粹是吹牛、DS 偷

bj45566 01/28 03:32接 OpenAI API、DS 不能問 8964 所以是垃圾、DS 是

bj45566 01/28 03:32中國做的我才不想碰,... 相比之下真的笑死人

KiwiSoda01 01/28 04:15加速ai costdown怎麼看都是利多 跌只是反應已經投

KiwiSoda01 01/28 04:15注多餘成本在model的公司上 既然開源 到時候大家還

KiwiSoda01 01/28 04:15是看誰算力多 買鏟子的不會輸

jokerlin702601/28 04:32短空長多?

achinyu 01/28 04:58中肯

pooiuty 01/28 05:56感謝DS,讓我有機會買到便宜的NV和TSM。拜託,再多

pooiuty 01/28 05:56殺點,最好能腰斬,我一定買爆

Prof68 01/28 07:39推!終於有技術討論文了。台灣完全壓台積電的缺點浮

Prof68 01/28 07:39現出來。竹科很快就要大裁員了。