Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也
※ 引述《icrose (人本良心)》之銘言:
: 但是問題在於,如果中國中小公司用沒有一個海歸的團隊
: 就做出了這麼優秀的演算法優化
: 那如果全世界一起繼續優化,這半年又大幅發生成本降低怎麼辦,變形金剛模型其實算法: 主體框架五六年沒有大的進化了
: 所以輝達和openai的只有堆算力一條路的敘事欺騙了世界兩年,現在敘事光環已破
: 用戶尤其是大用戶必然要重新審查自己的對輝達下單量。觀望或者只買原計劃的一部分是: 理性的
: 中小用戶因為自搭模型門檻降低而發生需求大爆發,要等到什麼時候呢。目前不明朗,我: 覺得,先跌2個月再說吧
應該不用那麼久
重點是DS是開源的
現在應該有許多數據中心已經開始實驗DS的演算法
我們先假設DS的創新
是往AGI道路上的王道
那麼在10萬張H100的算力訓練下
應該很快就能看到LLM的表現
在10萬張H100的暴力訓練下,質的突破
如果10萬張H100
跟2000張H800的訓練結果差不多
推理準確性沒有辦法有質的提升
那這個演算法不過是一個
地板很容易達到,但馬上會碰到天花板的
低成本的,但無成長性的演算法
馬上就會被要求更高準確性的模型區別開來
結局就是只能當基礎的,低成本的,內卷模型
如果10萬張暴力訓練,迎來質的突破
那算力依然是AI碾壓的條件之一
-----
Sent from JPTT on my iPhone
--
有道理
跟我想的一樣
怎麼會覺得 開發者沒試過一萬張
這個才是正解
內捲模型才好推廣阿 才有市場競爭力
現在AI在專門類有用,但泛用性真的不怎樣,真的希望
能加速一下AI進步速度,不然通用性應用真的沒啥用
AI模型現在就是遇到拚多多了 直接跳過蝦皮
總覺得很像之前超導體 最後虛驚一場
但是會不會10萬張下去天網直接誕生(對不起
Deepseek=超導體2.0=ChatGPT套殼
=中共割韭菜
如果AI進步只能靠堆硬體真的死路一條
接下來是換h100大出貨吧XDDD
已經在脆上被揭露只是Open API串接
假如給DS的硬體是OPENAI的算力,會如何?
所以華爾街都笨蛋嗎
華爾街有時候表現真的像笨蛋一樣XD
常看美股就知道華爾街初一十五不一樣,常常洗自己臉
OpenAI串接 那OPEN AI不就噴爆
我想看看如果這個訓練架構真的可以這麼有效率,10
兆參數的LLM會有多強
華西街找理由割韭菜賺大錢 哪裡笨了
DS出現會加速AI之間的競爭態勢.
好像有道理
抄底抄起來
華爾街天龍國被疫情和戰爭耍得團團轉也不是第一天
沒錯 看ds跟AI的天花板
推
![圖 DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也](https://i.imgur.com/OBFxyQJ.png?e=1738431985&s=nsNfPDHJDMyR5d5RAH6KaA)
微軟去年買了45萬H100
DS的出現等於中美AI競爭開啟.
抄底啦 盤前直接開撿
合理推估deepseek從各種管道買進20萬個H100來衝模
型
那十萬張gb200能直接實現奇點嗎?
如果科技巨頭認為不停堆算力就能達到新境界 太好笑
Goog買那麼少ㄛ
只是串接open AI?那是騙錢嗎?
華爾街長期還是看財報,短線就跟鄉民一樣湊熱鬧到處
喊而已,這種短線常常喊完沒多久就自打臉的一堆,短
線看華爾街反映只會被割韭菜而已
https://reurl.cc/EgyGVv Miula正在直播講deepseek
Ds 那麼猛 中共為什麼會讓它開源?
在還沒有實現 AGI 的現在,如果 DS 可以加速的話,
會更多人買鏟子;如果 DS 的天花板很低,大家還是只
能乖乖買鏟子。買鏟子概念股明明就很穩,推測今天這
波下殺只是找個藉口殺散戶。
永遠要對中國數據存疑,就讓子彈飛一會,不要太急
而且DS是蒸餾OpenAI的數據,之後要發展更強大的模
型模型的成本只大不小
差別在原本可以用gb200薛人現在變成h100
不過對gg就短空而已,東西都他做的
而且我不覺得硬體僅不只會停在h100 遲早會往上堆的
fantasystar 市場上買來訓練AI核心的晶片是少數
絕大部分是拿來架平台 給一般企業call訓練自己的AI
應用
推,模型train出來後面學習的怎麼樣才是重點
以Meta訓練Llama 4號稱史上最大叢集 10萬張H100
怎麼會有量變引起質變這種理解
資本支出也才30億美元
Meta用來架構平台的資本支出是650億美元
也就是meta用來訓練自家AI的支本支出, 是架構商業
應用平台的1/20
整個AI市場 訓練AI核心的資本支出 應該只有平台的
零頭百分點
目前市場有能力訓練自己AI模型的 就幾家大頭
DS會讓這個門檻從幾十億美元 降到幾到幾十M
會讓架構大規模商業運用平台的成本 從百億 降到幾億
巨頭會比你還笨?早試過高參數的模型了,事實上就
是沒有太大的改善,所以低參數的勢必會來臨
所以我的重點在於 AGI 跟其他目前還在"願景"裡的那
些AI夢。做現在的AI應用可以很便宜,但是要往前走還
是要繼續買鏟子。
聞起來,是不是有 over booking 的味道
我就跟你說了 做核心的只有整個市場資本支出的百分
之幾
pre-train就是快到極限算力推不動了,才在玩推理模
型,
就算這百分之幾還是大量買鏟子 那也是百分之幾
更何況這些做核心的 也會參考 DS的模型 改善自己的
效率 以前要10萬張H100訓練的模型 現在只要2000張
你說鏟子還要多賣?
算力成本降低,我看好應用端而且不需要太強的硬體
投入的廠商會多好幾倍 但這些廠商需要的硬體能力
只是過去的幾趴而以
AI也不只LLM吧,現在高端硬體依然供不應求,也不是
想買就買得到。
如果優化演算法效益開始遠超買鏟子
那鏟子的需求量勢必崩盤好嗎
鏟子貴到爆 錢轉去搞演算法反而更划算的話
你覺得他們還會死命買鏟子?
部分的投資轉移會是更明智的做法吧
覺得不會的記得放空,覺得繼續買的記得加碼
聽Miula分析完 感覺變成送分題了 0.0
加倉+1
我只知道巨頭的AI科學家會拼命優化演算法
不然被LAYOFF就是他們了
miula講什麼
為什麼一堆匪區的用語
現在的問題就是 天花板要怎麼破 不也還是堆算力?
不然deepseek還有什麼好方法能在有限算力下突破?
現在最強AI的能力 是遠遠達不到大眾用戶需求的
為什麼AI現在商業化應用化困難 就是AI遠遠不夠好啊
miula講的基本跟我還有S大講的差不多
DS出來能加速大家AI突破天花板真的是功德一件
那些大公司做服務平台框架 對啊 那裡面的東西呢?
模型不夠好 那就是繼續堆運算啊 你裡面的東西比別
人差 別人幹嘛用你的框架
現在不要說算數學寫程式 連最基本做客服都很難用
True
miula剛剛明明就說 接下來幾個月 這些大公司會開始
修自己模型
其實DS指出方向 大家很快會跟上
但不會影響軍備競賽 你沒聽到嗎
改良演算法可以省幾百億美元 幹嘛堆算力
低成本ai好用又厲害 美股完蛋了
他是用全新的方式不是堆疊硬體,中國被封鎖成這樣
,只能創新
長期來講還是會堆 但你這個幾個月呢?
省幾百億大家一起省啊 然後呢 誰能勝出還不是繼續
花錢搞模型
我不在乎這幾個月啊…
而且長期來講 就算會堆 利潤一樣嗎?
cisco現在的營業額是2020年的三四倍
打錯2000年的三四倍
你說股價是多少?
以AI那個廢的程度 不堆就是贏不了 又不是消費者很
滿意現在的AI
只要步調晚個幾年 競爭者就有可能追上了
我相信AI算力未來還是會繼續突破 但好不好賺就是
很明顯現在AI就不可能等你個幾年啊 大家馬上抄答案
那誰又能贏?還是要看模型
另一回事
為什麼不可能?
看一下網際網路的歷史吧
那個不是叫等幾年
本來就不可能 因為大家一起抄一份答案那就是一樣
所以更不可能等 就是要繼續拼
NVDA的成長率下降 原本的營業目標晚個幾年達成
就是步調不能慢才更要加碼投資啊....慢幾年
結果就是像網際網路當時的cisco一樣
慢幾個月就死人了 怎麼可能慢幾年 X
2000年的網路早就已經框架服務模型都建立好了 跟現
在AI差遠了
當年其實就是網路泡沫 短時間內大家降低資本支出
其實也沒有幾年的時間
2000年模型都建立好?
巨頭成本降下來 開始賺錢了 更有本事買更多算力吧
google都是2004年才有的 更不要說後面的一堆應用
比起現在AI 2000年初期的網路已經是很多人覺得好用
的模型了
2000年沒有gps結合網路地圖
其實要再造2000年盛況 就是需要更多的DS時刻吧
是沒有 但基本的網路連線在當時已經不會有人說「幹
怎麼這麼不好用」
一開始網路超貴的 誰要玩?都馬有錢人在玩
後來越來越便宜 網路費大眾可接受 才一堆人搶進
現在是你花20美刀然後罵 靠北怎麼這麼笨 難用 退訂
應該說DS指出另外一個方向吧
google框架服務在2000年當時有類似的只有mail吧
當所有人都進來後 會再炒一波到高點 然後重摔
那是貴跟慢不是難用,大家一開始就都知道網路好用
AI現在是貴不說 還他媽超難用 那個模型有夠爛
AI這兩年 基本就因為成本太高 根本沒幾隻加入吧
不會 其實2000年之前很多人不知道網路能幹嘛
現在DS幫大家降成本 大家可以進來玩了 才會再造達抗
而網路堆到4G後再怎麼堆效應不大,沒人會嫌網路太
慢,但你願意多付多少錢買超過100M的網速?
到時候大家服務框架架好 就是要拼模型了 現在反正
大家模型都是垃圾
不然2000年網路上只有10間公司 8間巨頭 會泡沫?
大公司也一定會下來拼 那除非硬體上限到了 不然誰
敢不拼
現在遠遠不到4G吧?大概3G都還沒到
看看4G多普及了 AI有普及嗎?
不認為 短期內巨頭應該會降低資本支出 著重於改善
演算法
對 現在市場需求高但供應商拿得出手的模型 誰覺得
「堪用」
一般人拿到AI根本也不曉得要幹麻
2000年那時候其實也沒有甚麼拿得出手的網路服務
可能只有Yahoo跟mail?
你可以用手機直接叫AI幫你訂外送麥當勞嗎?
短期要拉開差距 是要買更多吧
現在的AI比較像是用郵差送封包,堆算力就是在用更
多的郵差送封包,新的演算法就是直接用光纖送封包
你我都夠老了 拜託一下 當年2000年滿街達抗網站齁
當然你要跟我說所有巨頭一致決議先不搞模型了 都先
降支出 不要拼死拼活 那短期股價回700 800 那剛好
撿好撿滿
現在買更多 不是拉開差距 是浪費錢
現在已經滿街都是AI公司了嗎?
現在的確滿街都是AI應用公司啊 阿貓阿狗都說自己是
AI
你怎麼知道是浪費錢?當初台積電買EUV 三星沒買 台
積電浪費錢嗎
結論就是現在AI遠遠不夠力 天花板還遠的很
DS可以加速突破天花板 但依舊遠遠不足
幹拜託 你我都知道那只是掛羊頭賣狗肉 真正有在做A
I模型的就那幾個
AI天花板的確還沒到 但短期內算力過剩
接下來就是有很多中型公司也有能力做 平台了
你不買其他人買 演化算法就是比你快 不買嗎
巨頭們有資本有錢 一個突破口可能就甩開對方了 誰
敢賭?
微軟的AI資本支出是原本是宣布800億 meta是650億
大家都說我有在用 哪有阿貓阿狗說自己AI公司....
算利過剩? 有這麼快喔
但接下來可能20億就能做到微軟的規模
甚至我不要做那麼大的平台 只要2-5億資本支出就好
直接比較一下AI公司數量跟當年達抗數量 還早得很
你還在家服務框架啊 現在如果真的大家都能輕鬆做到
這個 裡面的模型才會是決勝負的戰場
正解
裡面的模型就是用開源的DS改啊XD
會浪費不就老美算法太廢了嗎 連硬解都做不到 優化屎
沒又明確數據 都不能說算力過剩吧
那就還是很廢啊 你要比別人強就是燒錢
幾個月後就會有用開源的DS改出來 訓練半年的平台
出現
問題是你砍支出 那我馬斯克就維持原本支出 規模是你
很廢是很廢 他收費只要現在微軟的3%
大家都一樣的起跑點 別人拼你敢不拼嗎?賽局理論嘛
除非大家講好一起節省支出
10倍 更快突破天花板 你微軟臉書要玩嗎
誰說別人會拚?
這種AI 不意外會有很多種 看要用哪一種
你承擔的對手不會跟你一起減少支出的風險嗎
你維持現在的資本支出 那算力短期會膨脹50倍
有這麼多需求嗎?
你覺得不會拼?拼一發可能就是台積電買EUV後的差距
中國政府自己都加碼一兆人民幣做AI支出了
不會拼 因為市場沒有那麼多算力需求
巨頭已經投很多了 還能投多少? 前無限? 看一下市值
新聞都出來了 你覺得美國投資者敢收手嗎
訓練方式不同而已 幾百e的巨頭 也是會優化繼續突破
幾年後可能有 但幾年後的利潤就不是現在這樣
市場根本就還沒開發起來 需求根本沒起來吧
是啊 市場幾年後還會更高 但我剛剛就說了cisco
你也不知道會不會有50倍對吧 好用的東西 以現在AI
這麼不好用的情況 也不普及的情況下 做出來50倍根
本不誇張
AI現在就說商業化困難了 需求就隨著天花板上去啊
現在的營收也是2000年那時候的三四倍
沒開發起來(X 沒有白癡會付費買AI(O
老黃也說過 還有機器人市場 機器人根本不work
而且你也要確定大家敢賭現在沒人能突破喔
50倍是前面有人算的 就算不是50倍 可能也有10倍
10倍miula估的
如果先投的注定是給後來者做嫁 你還要投多少?
機器人又是另一個需要算力的市場 而且還更早期
如果維持現在的資本支出 那算力就是暴增10倍
市場有這麼多算力需求?
現在堆算力的模式,不正是算力能帶來推理模型的正確性提升,大家才開始堆算力?想看看算力持續進步,演算法天花板到底在哪裡? 如果天花板已知,純服務需求 那服務vs GPU購買 無論如何也支撐不了NV現在的GPU費用吧 正是因為天花板的未知 才讓堆算力得以成為故事線 如果演算法的天花板已知,勢必支撐不起GPU的價格 如果演算法的天花板未知,算力依然可以主導 這樣說的通嗎?
因為現在算力還不夠啊 所以要優化阿 縮短時間
是不是以為AI只有LLM?自動駕駛呢?醫藥科學呢?
DS這次只有針對LLM優化喔 多模態還是原樣耶
語音AI 圖像辨視AI 都遠遠不足 天花板在哪?
優化也是要縮短訓練時間 所以好gpu不買嗎
巨頭要先說服股東們繼續大額投入吧
現在根本不夠 真的夠早就商業化了
所以馬斯克搞機器人是傻了還蠢了?
1.你要先確定如果有公司在算力以上突破 他漲不到50
倍 或是10倍的收益 2.誰敢賭這幾年不會突破?DS這
也是一個月內發生的事 到時候可沒後悔藥吃 3.大公
司就屌在他資本大 以上兩點他們能燒錢做得比別人早
Intel 三星當初就不跟台積電一樣拼EUV 結果爆了
需要算力的領域太多了 有太多東西還需要優化突破
微軟800億現在20億就能達到目標 780億當然會去發展
其它領域的AI啊 你不發展 那馬斯克就搶走了
老馬都說了DS大概有五萬個H100
量變引發質變叫做湧現,GPT已久出現過了
分一點支出給其它領域的AI也是一件好事 LLM吃太多了
但對老黃來說 能每個地方都跟他求晶片是最好的
多模態是一個大坑 機器人更是坑中之坑
然後中國也瘋狂在發展機器人 美國輸得起嗎?
現在麻煩的是 你敢收手 競爭者馬上補上喔
少一個就少一個讓他喊價的空間 但總之我不認為大公
司敢在這個節骨眼放棄模型的算力 因為你無法確定別
的巨頭不會在這一兩年突破…突破之後還要突破 因為
AI真的太草創了
奇怪,不是一堆人說抄的,現在有需要研究嗎?
沒人否定DS啦 他敢開源給大家用就是有料了 問題是
這一開源大家又在同一個起跑點了
現在LLM又不是只有語言模型, 結合推理能力, 所以才
會很多人把LLM當作通往AGI的半成品
就問為啥DS不要給自己人玩就好 可能也是希望AI能大
家一起來做大
而且就算自駕 也是需要LLM作為指令輸出跟輸入的
人機介面
現階段 大家用幾百億資本支出建設的基本上都是以
LLM為基礎的生成式AI
你講得完全沒錯 所以你認為現在LLM指令輸入輸出穩定
嗎?裝在自動駕駛上你安心嗎? XD
MoE有多少大資本支出在建設?
總之我覺得沒有大公司敢在這個節骨眼上降低對硬體
的追求啦 沒人敢賭 一個突破可能是60%的市佔率喔
我現在談的就只是這幾年的資本支出 還有股價
不會 大公司要考慮成本跟需求
推理能力基本上還是基於文字接龍 串接其它多模態呢
而且那個60%是各領域全方位的 誰敢賭這麼大…硬體
不足導致競爭力下降的慘案這幾年就有人親身示範
DS裡面完全都是優化文字接龍的部份 所以圖像分析還
是一團糟 國中幾何題都答不來
可以參考2000年 當年大資本投資的公司現在幾家活著
是啊 以DS也才一個月內就翻盤的東西 哪間大公司敢
保證不會這一兩年就有人突破了
所以deepseek還要花一年多優化多模態這部份嗎
AOL? 時代華納?
網路泡沫那時候的規模跟AI根本不能比 AI有在競爭的
公司跟市場飽和度差那麼多 做出好用的模型馬上吃下
來市場了 誰敢賭
沒錯 模型有可能繼續突破 那就更不該堆積算力
板上也有業內已經說了MoE也不適合做機器人的大腦
網路泡沫那時候也是很多大型ISP在競爭啊
最後合併 倒閉
這又是另一個坑 另一條路
所以要讓機器人能在工廠內按你指令行動 這不用算力
不用研發 也不用支出 還是這裡也能優化98%了?
其實 nvda=當年的cisco, 微軟 meta google就是當年
的AOL 時代華納 AT&T
你不做這塊 過幾個月中國又超過你了 你就完囉
我覺得是你想多惹 現在的市場需求飽和跟那時候還差
太遠
當年第一波的ISP, 最後都沒活下來
2000年也遠遠不到飽和啊
2000年時的網際網路真的只是剛開始
2000年網路公司的整體規模大多了
但當時的ISP就是過度投資資本支出
最後死光
當年2000年cisco PE是100倍 NV現在PE比三年前還低
其實現在AI應用公司也很多 也跟當年一樣 能賺錢的
不多
要變思科喔 慢慢等吧
現在打著AI應用招牌的公司多如狗
為什麼能賺的不多?因為就AI太爛啦
當年網路也是這樣啊
AOL提供的服務就是mail
天花板就是需要你突破才能符合需求 不然應用怎做不
起來?
但是美國存活了 我們是做材料又沒差高階還是要用
而且那時候mail還是50MB之類的
就算r1這種等級 也還是不符合應用端 商業化困難
是 我也認為天花板幾年後會突破
就像當年2000年倒了一堆公司 2004年又起來一堆
現在真正有在提供服務框架並且有人願意花錢的就那
幾家 要倒也輪不到他們
很難說
當年大家也認為AOL 時代華納 AT&T 這麼大 怎麼倒
我覺得DS這種新創一直出來 說不定這一兩年就看得到
反正要倒也輪不到NV 台積
但只要有一家用DS架構的 能提供殺手級應用的
AOL 時代華納 AT&T就這樣倍google幹倒了
但要到大家都進來玩 DS才是開第一槍 之前都太貴了
當年google幹倒這三家 其實最早靠的是2G的mail
你沒有算力我很難想像還能突破啦
然後就是搜尋引擎
但玩的也只是LLM而已 其它領域還在地上爬
一切都還很難說
另一個應用端準備起飛的就是自動駕駛 這也還沒好
我是覺得還好開發出 DS是中國公司
如果是美國公司 那很可能就是這個時代的google
真的跌了就是進來繼續撿2330
沒有這麼誇張 DS基本上就是優化成本這部份而已 總是
會出現的 老黃自己去年都講過了 演算法一定會改進
他說超級摩爾定律不是說他自己硬體會進步 是全方面
怎麼可能跟google比
這演講訪談都在 老黃自己都很清楚一定會有人搞優化
但這是好事啊 GPT3也是大量優化才成的
當年google第一步其實也是優化搜尋引擎的演算法而以
不如果 沒有優化 一直都給巨頭寡佔 反而麻煩
然後大家都賺不了錢 客戶賺不了錢 最後還真的不買硬
體了 現在獲利有望 更好長賣
反正 我不覺得巨頭們有理由保持現在的硬體投資
的確 現在AI是難用到會退訂的 沒消費你再怎麼獨佔
都會泡沫
老黃也希望客戶大家都賺錢 你不希望客戶賺錢嗎 XD
幾個月後 他們優化的模型 如果還維持現在的硬體投
資 算力會暴增
有理由啊 就是FOMO仔 就這樣
不然你抽資砍單試試看啊 別人馬上買走
算力不足的情況下 巨頭會盲目追逐算力
中國那邊是因為被禁 不然DS自己多想買GB200啊
但算力暴增十幾倍 幾十倍的情況 我不覺得還會維持
想買是一回事 想買多少是另一回事
沒有不買啊 800億砍一半也是買
算力暴增更好突破天花板 更容易商業化 更好賺錢
沒那麼多需求怎麼賺錢
砍一半 馬斯克和臉書就通通收走啊
你確定好用的AI市場還會是現在這種規模嗎
微軟會說投資800億 應該也是考慮過需求
就跟你說就有這麼多需求齁....
我就說了 幾年後一定不是這個規模
現在是超級難用 公司在買之前還要審慎評估這個那個
選一個 不好用退訂喔 實際情況就是如此
現在網際網路也是2000年的幾百倍規模了吧
現在網際網路也是2000年的幾百倍規模了吧
我剛講多模態跟機器人 自駕 醫藥 這些都不是需求?
但初期那些公司現在如何?
是啊 但我要問的是巨頭能確定這幾年不會有突破嗎…
?他們彼此可沒講好要省錢
即使是LLM 再聰明個一倍我看也達不到需求
我相AI五年後需求可能翻倍
但現在講的是短期的資本支出
你要省錢OK啊 中國可沒有要省喔 人家投一兆勒
而這個短期的資本支出 就會給對手追上你的機會
現在的發展可不是等「幾年」 可能三個月後某一個天
花板被突破 市場需求就打開了
網際網路的例子就擺在那裏
五年後需求翻倍 你現在砍資本支出....
我也講過台積電的例子了
10倍的算力爆發 應該不是幾個月就能被突破的
台積電什麼例子?
這不就你講的 給對手追上...誰敢砍啊
五年後需求翻倍 你現在的算力都還夠用到五年後...
如果五年後只是翻倍的化
簡單來說你敢不敢賭?就是選擇嘛
我已經下注了啊 我基本上沒有大手平台的股票
對啊 你怎麼知道只會翻倍 現在市場規模很小欸
哪裡夠了...我就說 客服AI普及了嗎?
NVDA也只有很早買的
那到底五年要翻幾倍? 有50倍嗎
維持現在的資本投資 很可能算力是暴增50倍喔
需求有增加這麼多嗎
反正過兩天微軟財報就為講了 你看他會砍還是加碼
順帶一提 阿祖知道DS事件第一時間就說要加碼喔
現在隨便一個突破市場可能是5-10倍需求喔 畢竟現在
你看現在NVDA的股價 不就反映資本市場預期嗎XD
真的有在應用AI的公司你知我知都是少得可憐或覺得
不好用
50倍還是不夠吧
5-10倍 那還是沒追上暴增的蒜力耶
初期進步大家都很快
過一年翻5-10倍 兩年呢?三年呢?AI就很草創嘛
NV股價在DS前就在這區間跑半年了 都市值第一了
好啊 讓你三年追上50倍好了
三年時間不就是網際網路翻版?
3T公司要拉本來就要磨 跟以前狂拉10倍不同了
泡沫到出現google, 其實也就是三四年
三年50倍 到時候你再暴增算力嗎?人家單都排好了
其實網際網路的前例都在 自己看吧
反正我用台積電當例子 賭對就是先進製程90%市占率
賭錯就是intel拆分收購
一開始 巨頭們在高成本時代大量投資 突然紅海出現
也有可能反過來 賭錯了直接倒 但我覺得輪不到賣鏟
子的NV
兩三年後 頻寬跟硬碟成本大幅下降
然後高成本時代大量投資的巨頭死光光
cisco也沒倒
如果現在不需要這麼多算力 為什麼要現在佈?
網路當時就已經比現在AI的成熟度高了 至少一般人用
起來不會靠北到死
3 年後同樣算力的成本可能只有1/10
會喔 2000年其實大家就收收mail
慢到爆炸阿哪有不會靠北到死==
你不現在佈局人家一下子突破你沒單你要怎麼爆算力
呢 沒人敢賭啊
頂多學生上bbs, web都還是很陽春的靜態資訊
其實大家都在下注了不是嗎
今天NVDA跌13%就是大家在下注了 怎麼會沒人敢賭
是啊 巨頭們下注 就看會是台積電還是AT&T
拜託三個月前吧 還有破百價 我是覺得別看這麼短
我之前選擇大量平倉 其實也是下注了
我NV持有價是還沒分割前的490 不多就是了
阿祖加大資本支出 然後今天創新高了勒 呵
你看微軟敢不敢砍支出
我覺得巨頭不敢砍 啊爆了就爆了 反正我不會下注服
務公司 頂多少賺
這種時候就是撿G 再怎麼樣五年後又是一條好漢
既然認為大家都不敢砍 那NVDA跌13%是?
是,我也是這樣想的
既然認為大家都在砍 那Meta創高是?
棄硬體轉軟體阿
但是阿祖加碼資本支出 怎麼加碼的創高?
不是過剩要砍單嗎
我就說了三個月前還有破百價 那怎麼跌的?讓子彈飛
一夥兒
破百價好像又近了
通常恐慌性賣壓都是進場好時機,已加碼
泛用(x 專用合體(o
再說一次 智障型手機成本降再低到1/500結果還是相同
智障型手機最後都是會被智慧型手機淘汰
現在的DS在AI發展中應該還沒達到智障型手機的水準
也就是說未來還會有更多更完備的AI模型出現
上面推文中也提到AI範圍很大 DS只是某個領域有成果
所以現在說未來高階硬體變成垃圾沒人要還是太早
資料模型演算法硬體的進步都是相輔相成
比較值得討論的是現在大廠搶硬體獲得市佔的策略
是不是會調整改成穩扎穩打按部就班
如果大廠不搶硬體對於賣鏟子的廠商來說確實較不利
但這跟高階硬體變成垃圾沒人要還是完全不同
至於股價高檔急跌在多頭中是很常見的現象
台積電要說空頭至少等到700之下再談
就算很急著要看空最少最少也先等台積電破1000再說
現在算力還是遠遠不夠,不然一堆自駕車幹嘛還用需要
深度資訊的光達,直接視覺方案就好了
4
中國市場真的很可怕。 只要政府大力推動某個產業,補助到一定程度,內卷就會開始,然後整個市場就會完蛋。 重點是,不只是把競爭對手打趴,他們自己也會拼到血流成河,最後整個產業一起死。 反觀美國,企業拿下市佔後,會持續擴大利潤,帶動上下游一起賺錢,產業能夠長期發展 。14
: : 心得/評論: : : 中國對美國的追趕真的到了窒息的程度。openai顯然不能叫openai,只能叫closeai了 : 再發酵幾天,我相信nvdia的股價就會受到打擊。高成本算力高歌猛進的時代即將終結43
先說 我完全不懂DS的算法 也不懂open ai的算法 但既然DS開源 那大家都能使用的情況下 未來AI迭代肯定加速 有人說我用1/50的算法就可以做到一樣的功能...是啊大家都可以用這套算法的情況下 那 還是得拼硬體 我用更強大的硬體可以推出更好的產品、服務 除非今天硬體本身的上限到了 沒辦法再有2
但是問題在於,如果中國中小公司用沒有一個海歸的團隊 就做出了這麼優秀的演算法優化 那如果全世界一起繼續優化,這半年又大幅發生成本降低怎麼辦,變形金剛模型其實算法主體框架五六年沒有大的進化了 所以輝達和openai的只有堆算力一條路的敘事欺騙了世界兩年,現在敘事光環已破 用戶尤其是大用戶必然要重新審查自己的對輝達下單量。觀望或者只買原計劃的一部分是理性的11
其實我覺得DeepSeek的影響就是當初電信市場裡面的台灣之星而已 頂多就成為 AI大語言模型公司中的一個價格破壞者而已 因為DS 最大的優勢就只是成本便宜 (這個還不一定是真的 有傳言說他偷用H100) 其實他大多數的表現都指是跟 OPEN AI的o1 差不多而已 甚至短期上下文記憶量更差34
先說 我完全不懂DS的算法 也不懂open ai的算法 我認為這不應該被視為中美對立 而是全人類的AI技術突然出現了大幅度的進步 以台灣的立場來說 希望能看到美國企業快點搶人
爆
Re: [請益] 費半成份股全線崩盤 怎麼辦?既然有人提推論,我就講看看訓練端 DSv3 論文中最大亮點,可能也是目前看起來崩盤的主要是 $5.77 million 的訓練成本 和他對比的是喇叭哥曾經說 GPT4 花了超過 $100 million 訓練 未公開的 GPT5 據 WSJ 說,每一次六個月訓練週期需要花超過 $500 million 簡單用 GPT-4 : DSv3 = o1 : DSR1 估計 o1,但應該更多啦,不過低估在這邊不重要29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了14
Re: [閒聊] 文心一言AI繪圖(慎入)文心一言實力不如ChatGPT是理所當然的,微軟投資幾百億美元並且用微軟的雲端訓練整個網 路資料兩年了,到了去年底才終於開花結果 目前這種LLM模型,最重要的就是 資料 算力 和算法,其中基礎的資料是非常重要的,Chat GPT在建立模型的過程跟一般的Ai一樣要機器學習建立模型,而ChatGPT的基礎原理就是由上 一個字生成下一個字,週而復始,其中在訓練的過程還會經過人工挑選優質回答和一些和添18
Re: [新聞] 聯發科AI平台MediaTek DaVinci「達哥」原文恕刪 小弟剛好最近有跟到一些台灣LLM的發展,可以補充一下關於模型的部分。聯發科的研究 單位聯發創新基地,做語言模型有一段時間了,之前有一版Breeze-7B模型,發佈了一篇 技術論文放在arxiv:7
Re: [問卦] deepseek超低成本計算是真的嗎?論文有公布 現在就看各家機構要不要去做重複性的驗證 然後使用MOE的稀疏模型,成本一定很低 這無庸置疑 在專業領域一定表現的會比較好, (單一任務:寫程式、問數學等等)5
[問卦] 通用AI會不會永遠都達不成現在大家都想研發通用AI 也就是具備與人類同等智慧 或超越人類的人工智慧 能表現正常人類所具有的所有智慧型行為 現在大家就狂堆算力1
Re: [新聞] 輝達H100顯卡「訂價139萬」...上架就秒殺, : 但竟然已經賣完了,讓鄉民都好震驚。 : 輝達顯卡賣場。(圖/PCHOME) : 有網友在PTT「PC_Shopping」板發文表示「NVIDIA NVIDIA H100 80GB Tensor 核心 GP U3
Re: [新聞] 歷史一刻!美空軍部長親乘AI F16 高空纏鬥阿肥外商碼農阿肥啦! 很多人都忽略了發展AI的關鍵技術除了晶片外,最重要的是數據跟能源問題,接著才是關 鍵算法,這些都是台灣沒能力擁有的。 根據Meta自己開源的一些工作細節來看,當前Meta所有的算力為60萬張H100,假設這些都 全開到峰值,平均每張消耗700瓦搭配水冷散熱系統就會將近600兆瓦,這個是會將近六2
Re: [新聞]輝達設廠「2處機會大」 黃仁勳認擔心電力我這邊幫老黃緩頰一下,我記得之前有在八卦發過文,當前如果要做預訓練的AI模型這個 就是一個耗電怪物。以Meta訓練llama3 70B(以當前來說就真的是700億個參數就只是小 模型)的模型從零開始2.4萬張H100初估就足以批敵半座小城市一天的用電量,如果未來 需要更大的訓練光是10萬張顯卡一起動作就足夠讓一個城市的電網癱瘓,這也是為什麼電 力問題是當前各國都重視的,沒有足夠的電力就沒有安全的AI。1
Re: [問卦] deepseek會刺破ai泡沫嗎?不會 其實在美國 大家還巴不得有這種突破出現 2024年的AI還是在同一個transformer架構下堆料 拿更多東西訓練 真實世界沒有的拿合成的資料練 如果有一個更有效率的架構/模型 假設你拿五千張H100就能做出Deepseek R1 那些有十萬張的公司就能搞出更屌的東西
18
Re: [新聞] 去年12月總薪資平均近6.5萬刷新高 金飯15
[情報] 114年02月17日信用交易統計7
[心得] DeepReserch: 市值型 > 高股息10
Re: [請益] 台灣貿易順差超大 但為何台幣貶成這樣?7
[情報] 2032 新鋼 達注意標準 1月自結 0.0012
[情報] 00946 114/03/06 預估除息0.025元26
[情報] 3189景碩 113EPS 0.11(Q4 -0.55) 股利14
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 49
[心得] 券商app年度回顧25
[情報] 2942京站 獨董彭振聲 因個人生涯規劃辭任11
[情報] 5864 致和證 113年EPS 1.98 股利 0.4+0.87
[情報] 8028 昇陽半導體1月自結0.431
[情報] 114/02/17 八大公股銀行買賣超排行1
[情報] 0217 上市櫃股票週轉率排行3
Re: [新聞] 川普「對等關稅」預計4月2日上路衝擊歐日1
[情報] 0217 上市櫃外資投信買超金額排行