Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未
※ 引述《huabandd (我是阿肥巴你頭)》之銘言:
: 沒什麼好恐慌的
: 中國算法優秀,還是需要有硬體來使用
: 除非可以做到不需要專用晶片依然能有成效
: 到時候再來跑也來得及
: 該恐慌的是那些投入大量資源搞AI軟體的公司
: 不過話說回來,禁令似乎也沒什麼意義了
: 反正中國有的是辦法搞到這些晶片
需要算力沒錯
只是根本不需要這麼多
原本預估要10000台才能學完
但我發現只需要將資料先預處理
挑出重點再去學習
發現只需要500台就能學完了
所以結論就是我的確需要更快的GPU跟內存容量
但我不需要買那麼多了
--
所以會有更多公司加入AI行列
好還要更好 對那些想走前面的公司,還是會想買
會嗎?
先定義"學完"
原本是3巨頭*1000台 現在是人人有功練100家*50台
我猜是10000家*50 接著變成50*10
現在又不是終點 如果有新的應用出來 更多人用 還是
要有算力
AI不只LLM,可以拿去算其他項目
確實 現在就反應 寫寫文章 到底要什麼算力
人家小米家庭已經飽和了,apple生態圈就那點東西
深度跟廣度 自己選一個 不要跟applevision一樣
學完了歸學完了,要面對數億人還是需要大量鏟子,不
然就是當機還裝成被駭客攻擊
弄一個好棒棒的結果沒人要買
AI軍備競賽開打 算力這種硬實力越高越好吧
穩
搞不好是特定題目算的很厲害而已
iPhone停在16就夠用了 s25當最後一代差不多了 製程
不用推什麼2nm 也許14nm就夠了
拿DS預處理資料然後餵給其他AI練功 選我正解!
用什麼iPhone 照某些人的說法 用小米就好了
根本不需要每個人都有100台,怎麼還停留在硬體,ai
全新算法
這邏輯就好像說任何晶片根本沒必要繼續研發
台肯,大家應該用14400 bps modem上網就好
再多的小公司都買不到原本七巨頭要買的
看了傑文斯悖論後…大膽抄底
14400 bps可能還太快?
你用微積分難道是100計算機算出來的?什麼叫算法跟
算力
別人是空間到空間,你還在光速要多久
你說的是訓練 還有推理晶片這東西好嗎 = =
誰知道後續AI會用多少?大家也只是囤貨而已
後面你還是要買推理晶片
用99乘法表能解的題目跟實際運算還是有差別
學完怎麼定義? AI這麼快就到盡頭了嗎?
而且廣範圍運用的話也要很多伺服器或工作站啊
推理晶片對的,所以我買世芯沒有買NV
你是不是沒搞懂AI
算力還是需要,只是大家會思考有沒有必要溢價去追
求算力,尤其是現在買進最新的硬體,不到兩年可能
打骨折都沒人要
除了學,你還要有提供服務的算力支援
不然就是像DS當機
很壯喔
跟我念三次 AGI AGI AGI
學完什麼?你的大一微積分嗎???????????????????????
念AGI要幹嘛
AI這種東西快一步只會快更多,美國算法落後,再多
計算機也無用
老黃每年都在提升硬體性能大家GPT有越買越少嗎
美國算法不會落後 這種東西就是一家找出方法
其他家很快就會跟上
*GPU
實際兩者使用就知道差別,一個像似前5篇文章統合結
果,另一個前100篇文章分析統合,如果前5篇文章就是
重點,那後者分析確實浪費資源與時間,資料庫與資訊
來源變成節省算力的主因。
同意 市場為什麼會恐慌 不就是這個原因原先輝逹估價
價 就是依據市場需要那麼多GPU去估的 現在看起來
就是可以不需要那麼多 除非有什麼其他依據跌不會停
現在根本沒法預估5-10年後ai需要多大的硬體規模。
巨頭之前給出的天文數字其實也是主觀判斷
DeepSeek並不是靠什麼統合文章節省算力 不要胡說
要能估算個大概,至少要等商業模式和應用層的探索
都進行得差不多
什麼叫「學完」 我期待的完全自動駕駛和ai機器人
幫我煮菜洗衣服都還沒看到耶
中國放開源 注定無法賺錢 中國繼續捲死自己
你以為的學完的ai是什麼樣子?
DeepSeek是用了有別於OpenAI開創出來的訓練方式
把結果給7巨白嫖 簡直佛
我能不能用ai描述一個世界 就用vision pro讓我在
裡面探索呢 現在還差得遠吧
這個結論是ai已經是成熟的產品 已經沒辦法有太大進
步 問題是ai剛起步欸
老闆如果可以只請一個馬斯克,會請100個留美的嗎?
OpenAI的訓練分成四個階段
預先訓練 監督微調 獎勵建模 強化學習
幾百個臭皮匠敵不過一個諸葛亮,差別就在於腦袋(
算法)
預先訓練就是給AI大量文本 讓他學習語言跟知識
公司還是需要臭皮匠阿,廢話,但不需要這麼多了
監督微調 就是用人工貼標籤的方式 去糾正預先訓練中
AI產生的認知
昨天看到一種說法說開源也是無奈之舉,不開源沒人信
DS離AGI還扯不上邊 除非小女孩能低成本用演算法搞
出AGI 那才是真的了不起
只好開源讓大家抄來證明實力
獎勵建模 就是 建立一個獎勵模型 當AI做出正確推理
機制獎勵他
開源只是他也有用別人開源的東西……少講得好像很
委屈
強化學習就是讓AI模型自己跟自己練習
距離AI無所不在 還有很長的距離
這個是OpenAI建立的訓練方法 OpenAI出台之後 各家
硬體需求變低,相對就能讓原本負擔不起的公司變成
負擔的起,簡單的說,就是更好銷售硬體了,不再只
有那幾家客戶才會買
如果你覺得ai現在已經很成熟沒什麼新把戲 那算力
才會嫌多吧
LLM基本上都照做
原本以為要大撒幣才能玩AI 現在發現好像小資族也可
以了
像汽車 或是手機這樣
DeepSeek是把四個步驟的監督微調拿掉 不人為介入
告訴AI怎樣才是對的 而是用強化學習讓AI自己跟自己
練習 自己找出怎樣是對的
NV的digits迷你超級電腦會大賣吧 三千美元而已 中
國也會想辦法走私
這個基本上就是AlphaGo跟AlphaZero的差別
開源又不只它一家,meta也推出過開源模型,怎麼就
這次藉口特別多,還有外行的在吹開源代表它領先競
爭對手好幾代
現在的AI你覺得已經是終點了???
現在就看小資族AI夠不夠用 但沒人知道什麼叫夠用
AlphaGo是用大量人類棋手的棋譜訓練的
學完?AI的極限已經到了哦?短短兩年
他的棋路就是會照人類棋手的思路
AlphaGo是自己跟自己練習出來的 所以會走出人類覺得
不合理的棋
馬斯克有說AI已經學完人類的資料,現在都是自己生
成自己學習
但結果是AlphaGO棋力更強
打錯 但結果是AlphaZero棋力更強
DeepSeek的訓練方式也是一樣 電腦自己跟自己練習
不人為介入告訴電腦對錯
學完人類的資料只是記住而已 那他自動駕駛怎麼還
沒完成
我認為,我以為,我…,好了啦
結果照論文裡頭描述的 一開始DeepSeek的推理能力
你以為會跟你聊天就學完了嗎?
有這deepseek我覺得還會加速哩
發展很慢 結果有一天就開竅了 論文稱為aha moment
中國那邊翻譯做頓悟時刻
問題其實就是那個aha moment是不是人動了手腳
如果沒有給AI道德觀,繼續發展下去蠻可怕的
讓AI自己訓練自己 我自己猜 OpenAI早就已經在做了
DeepSeek就是不人為介入啊
又或者你其他問題上誰知道花多少算力時間才aha
要介入就是OpenAI的訓練了
花了多少算力時間V3是有公布的
用2美元一小時算 就是580萬美元
去年聖誕節時期釋出o3 工程師就再興奮要AI自己產程
這個概念特斯拉幾年前的ai day也有講過
然後他aha出來的搞不好很突破人類下限 就(ry
式自己改進 他這樣講是已經在做了 奧特曼聽到嚇尿
只是比誰做得更好
怎摸把作法不小心公開 母湯喔 又要被學走了 XD
沒有最好,只有更好;科技產業就是如此。
自動駕駛也需要ai自己生成場景去訓練 不然靠人類
的駕駛很多極端狀況的數據根本不夠
也不是科技業都這樣 像手機車子就沒啥新把戲 ai
可是起步中的起步
然後他就aha出水溝蓋可以跑(ry
很多問題 包含那個aha 反正他號稱是開源 自然會有
人去嘗試然後公布 讓子彈飛
除非DS的成果是大家認為的AI極限,不然還是要靠算力
往前推進
不是580萬 是557.6萬
今天你要拼命想才有一個很雞肋的新點子 那ai才是
成熟了 像什麼小米汽車可以跳過坑洞那種
要說DS對整體降本增效有功絕對同意 但極限 遠遠不及
這篇其實講錯 不是甚麼學完
我測太多東西了 真的不行 差得遠了 o1都不太滿意了
而是如果各家開始學習DeepSeek的方法 各家AI的效率
我講白一點 覺得r1夠用的人 其實只要用臉書的拉馬
都提升 那目前佈的算力是不是已經超過短期的商業需
也夠用了 根本一毛錢都不用花 超輕度用戶
求
DS就小模型== 到時你要接起來還是要大量算力
事實上大部分的算力並不是用來開發AI模型
提升要看程度 先讓國中數學解得出來再談
是模型建立之後 把模型佈在平台上 提供商業應用cal
l的
大多數算力就是拿來推論的 但推論便宜了就有更多算
昨天就說過 以Meta來講 訓練的成本不過30億
但平台的資本支出是650億
力來研發 可以越快訓練出可以解決國中數學的AI
絕大部分的資本支出 其實是提供商業應用 而不是訓練
核心
那些爛AI拿來商用 難怪沒人要用
算力效率變好 那應用需求能不能跟上?
原本預計每年投入多少資本支出 商業應用還是供不應
求 但現在效率變好 會不會幾年內算力過剩?
不能 因為AI就是蠢 不好用 便宜也沒用
大部分其實不是訓練 是應用端場景一直加進來改
這才是問題 不是甚麼10000片能學完 現在只要200片
AI蠢不蠢 目前都已經開始有應用了
企業要的是能滿足需求 再來談價錢 現在連需求都沒有
滿足 爛
有 但根本沒辦法普及 因為太蠢了
DS並沒有帶來質的提升
現在就連o1的質也遠遠不及商務需求
LLM也不一定是通往AGI的正確道路
也許有一天會發現走錯了 目前佈的都是錯的
如果好用 AI商用早就普及了 現在各行各業才在用....
*誰
我開100匹馬力的車也可以為啥需要200匹馬力的 你以
為需求是有終點的喔
就連麥當勞當年套個AI點餐機就被罵爆
你可以說人不懂AI 但你也不懂老闆要的AI
o1我看連麥當勞點餐都沒辦法 蠢得要命 還早得很
要是有用 夠用 麥當勞早就去談了 店員全裁光
算力永遠不夠
現在AI的需求沒看到終點 事實上連終點都還不知道在
巨頭囤貨就是在壟斷資源及價高後進者門檻.結果
問題就現在AI太蠢了 超廢 連點餐都處理不了
哪 但 真正的問題應該是 這幾年的需求是不是飽和了
學完不用?
畢竟現在AI能做的有限
所以我說那個醬汁呢 (X)
所以我說那個應用呢 (O)
太多東西 材料 蛋白 病毒 基本上算不完
誰agi先出來就能吃下市場
這個就像2000年的時候
需求飽和還是要繼續研發啊
不是需求飽和 是你的產品根本沒達到需求
那時候你能用網路做的事情不多
是網路沒用嗎? 不是 是應用沒開發出來
你要先有別人幫你整理才能分類
2000年那之後的兩三年的泡沫 不是因為網路沒用
2000年網路應用沒開發出來,部分原因是不夠快
而是當時的應用不夠 所以當時的網路需求上不來
等到應用出來才去搞算力就不知道落後多少了
不是 當時就真的沒甚麼應用
我想到個老笑話: PC只需要640kb的記憶體
2000年的網路,能想像視訊通話、Netflix嗎?
那時候就是e-mail 簡單的靜態web
嗯 那時候網路一部分是不夠快沒法讓影音起來
你知道agi需要的算力嗎
學完是什?
https://i.imgur.com/2CwbrC2.jpeg perplexity C
![圖 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/2CwbrC2.jpeg?e=1738344306&s=PPDJzJncRRFJ32zCkOP0xw)
EO
講AGI都講太遠
講得很好,以後不要再講了
現在LLM的方向是不是對的都不知道 就在講AGI
影音的應用是不知道嗎 不是 是用起來卡死不好應用
2000年那時候是真的很多技術都還沒有
用常識屁股想也知道 agi 需要的算力
沒有點對點的話 其實影音應用 到現在還是起不來
串流
你手機頻寬可能100M吧
你能接受下載一部片再看嗎
但很明顯現在的頻寬也可以暴力支撐老技術(ry
當年下載色圖或mp3等多久都有人應用(X
雖然不會太久 可能10幾分鐘
當然 也是有人願意等 但等的人就少
總之力大磚飛不見得不行 但DS幫他加速了進程
不然固網其實很早就100M了啊
成本降才能普及 頂尖的繼續去追求超高算力 一般人
用不到那麼多算力 總不可能要一般人都去吃頂尖等級
的成本 智慧型手機也是靠中低階大量普及
你看小了,演算法是可以進步的,才開始而已,並不
像人腦受智力上限限制
其實不見得有甚麼進程
下一步是AI AGENT
現在是要達到70B 也就是有意義的訓練量要很久
要花很多GPU時間
DeepSeek是大量減少需要的時間
有了技術,成本又能普及,資本市場自然會找到使用他
的方式。
但並沒有優化
達到一定的訓練量 能力成長就有限
你灌幾倍的算力下去 也不會有甚麼進步
所以說只有加速 LLM是不是朝向AGI也還不知道啊
要真的有進步 可能還要找到其他方法
能力成長有限 但並聯其實能增加覆蓋問題範疇就夠了
也許根本不是LLM
大概比喻就是你雇用一百個小學畢業工人跟雇用一千個
他就是沒法提供研究所智力 但可能可以做到便宜事了
是 現在的問題就是 市場有沒有需要這麼多勞動力
以前勞動力供不應求 但現在一個工人可以做10倍的
事情 會不會工人過剩
一堆東西沒學,當然砍半訓練
一堆東西沒學(X) 現在的LLM模型能力就這樣(O)
並不是算力丟下去 LLM就會飛天遁地
現在LLM的智力就是4歲 你強迫他念研究所的書也沒用
網路泡沫要到一堆空殼公司連產品都沒有就拿到資金
4歲小孩多看一點書會聰明一點 但總是有上限
然後股市裡一堆中小AI群魔亂舞
總之看記憶能力還能怎麼發展
成本計算的真實性是個謎,但投資肯定是先閃為妙
這兩年股票根本只漲七巨頭 中小死在地上
重點是"學完了"嗎
但感覺需要的不是HBM 而是CPO到硬碟怎麼辦(ry
除七巨頭哪家AI公司股價飛天的?還不就那些有業績的
看你學完怎麼定義 如果以4歲智商能念的書
應該是差不多唸完了
蠻多AI公司飛天的啊
什麼算力不用那麼多 ?你知道自己在說殺小嗎?拼命
獻曝耶
沒看到阿斯拉或賈維斯出來前一律當作沒念完(O)
哪一間空殼沒產品的股票噴飛天?
結論:all in tsmc
像各種機器人公司 從低點算漲三四倍不算多
要看你定義的飛天是怎樣算
特斯拉跌到200那時候更慘,一堆人說賣車的估值這麼
高不合理
DS節省的訓練的算力,沒有提到推論節省多少算力吧?
RBOT也是還沒產品 但從低點噴四倍多
當然 我是期待他產品真的有用 可以噴100倍啦
2000年納指四年漲五倍 現在兩年連一倍也沒有......
其實很多喔
這種公司數量遠遠不及2000年.....
位階差那麼多哪能這樣算
看衰的人 那你們要買什麼 還是要做空呢?
10000人的工作500人就能做完?太棒了
以後給他們20倍的工作量!
位階跟這又沒關係 2000年可是沒有QE耶
連2000年網路泡沫化都出來了 也太離譜
我打開我的AI&Robot自選組合
股市在高位沒錯 但泡沫 還早 那時可是一片樂觀
我看大概有一半是沒產品 或是產品幾乎沒營收的
老黃躺在這半年了 樂觀在哪?質疑聲從沒少過
實在可悲 不為難空空的思想了
QE是在AI爆發前 AI爆發之後一質都是QT
看到板上 哪次老黃大跌不是半信半疑 這樣哪來樂觀
合理的推論
機器人也要考慮中國的競爭呀,他們的機器狼是世界
頂尖
從ChatGPT引發AI爆炸成長到現在 都是高利率+Qt
話說八月那次也是拿泡沫出來講 結果勒
再來就散戶公司進場,紅海化的速度越快需求越高鏟
8月那次喊台積電300-500的人呢
子才賣得動
重點還很剛好 每次都在財報前 還真的沒一次miss
我記得23年底財報前也是狂殺20% 網路泡沫論也是滿天
一個80分 一個60分 誰會願意花時間在60分那邊
4月盤中跌一千點喊一次 8月台指期跌停再喊一次 總
有一天喊對AI泡沫
總市值75.53兆 隨便就跌去1/4 台股!?神!!
絕對有泡沫爆掉的一天 但到時板上絕不會有任何看空
直到那時 就真的完了 哈哈哈
絕對是當大家瘋狂買進的時候才會泡沫 現在是一片看
空
Cisco在網路泡沫爆掉的時候也沒比軟體股慘
基建的基礎就是鏟子賣出去了就回收了
學完XDD
覺得考95夠了就等著被靠120幹死 不懂救繼續當快樂寶
貝吧
但是Cosco 2000年用一年時間從80元崩到20元左右
*Cisco
95太抬舉它們了 現在連60分及格都沒有 實用性的話
GPT3就是個概念 新奇 但垃圾 GPT4改進一點 但沒用
一直到了o1現在 才非常勉強可以用在特定工作上
GPT4之前胡說八道問題太嚴重 現在越來越少
我記得幾個月前 也一堆人擔心 AI胡說八道問題沒法解
那一定會泡沫勒 現在呢........
那原本的1萬台不就可以算更多東西?
NV先腰斬一次回80吧
AI 又不是已經走到極限了,哪來學完
你大學學完,腦袋就能丟掉了嗎
從openrouter這個網站來看,DS v3 latency 6秒
你覺得現的功能可以嗎?
4o latency 0.6秒,這也是成本差距吧
GPT3都幾年了 這幾天去踹去吹的 也有說就GPT3.5
你不要買啊,你就看別人賺爛就是這樣而已
然後大家都從500台開始,一路捲到1萬台,你覺得誰
的比較強?
使用的人越多越需要買
垃圾中國deepseek是面板套用人家gtp當輸出
拿人家的結果當成自己的輸出 真他媽白標
看到學完就覺得好好笑 拿OPEN AI來當目標的話 那當
然有學完的一天 但事實上OPEN AI還有一堆缺陷
智慧這種東西怎麼可能有學完的一天
講的好像ds已經是最終答案了
猜AI練題完存答案 不用再run一遍
確定?更多中小企業可以玩自己的i’ll了 算力需求
是下降?
llm
不是喔 資料量只會一直變大
就像以前以為電腦進步會越來越小台省電
看起來就是輝達晶片要賣爛了......人人有you
gpu
除非你覺得現在的AI已經完美不需再進化了,否則硬
體需求永遠無法滿足人類的慾望
那你繼續用十年前的顯卡CPU玩遊戲啊
為啥18124突然怎麼懂AI啊?
直接買10年前的硬體,不是更省成本,為啥買今年的產
品?
10年前的製程成熟到爆炸,為啥買今年新上市的?
500台不用錢嗎?你以為是一台嗎…
更多小公司少量卡都能做 噴
光看到學完就知道沒參考價值
8
簡單說明一下為什麼NVDA暴跌 很多人一定覺得很奇怪,然後各種文組出來表演秀下限 簡單說NVDA能在40系GPU出來的時候打爛AMD , 就是因為他們的AI級伺服器GPU , 例如A100 還有H100 然後Deepseek現在告訴你 , 這些為了AI打造的GPU都是垃圾 接下來我舉個簡單的例子,Intel曾經想推動WiMAX 來一統高速無線網路9
如題 我覺得大家不要太慌張 幾個點幫大家分析一下 首先 做出deepseek的公司叫深度求索 是由中國對沖基金 幻方量化出資成立的54
Deepseek用更多輝達晶片有兩條路 第一、用更多H100,輝達跟這個ai產業鏈股價崩盤, 現在市場給輝達跟Ai產業鏈的股價是基於必須生產更高階的晶片, 如果Deepseek證明大型ai模型只需要H100等級的晶片就足夠, 那市場還會買單gb200、gb300甚至輝達說一年隔代一款ai伺服器的構想嗎?29
我之前有Po張大型主機的圖 主要就是抨擊現在搞AI的方向不對 幾百億美元的硬體加上數億的電費 這就是當時電腦的狀況 大型臃腫 走不進民間 AI如果是堆一堆硬體的算力而來,能用得安心嗎?77
: 我認為關鍵是高階晶片的成本、功耗跟其邊際效應的問題 這邊先聊聊協和號的故事: 他從1969年首飛,1976年正式商用,協和號從巴黎到紐約只需要3個半小時,同樣搭乘波音75
我認為並非高階晶片成本的問題,是做事方式的問題 長期以來軟體工程師並不以最高效率完成一個功能為目的,因為算力過剩 中國因為算力不足,無法用無限的預算去燒,所以精進算法 簡單說算力不足有算力不足的作法,彎道超車成功 那算力重不重要?當然重要,如果今天中國算力充足,又使用DeepSeek的算法,那就真恐怖26
這到底有什麼好恐慌的 妳說邊際效益遞減 那是在已經成熟的市場下才會有這個效應 搭飛機的例子 紐約到倫敦6
沒什麼好恐慌的 中國算法優秀,還是需要有硬體來使用 除非可以做到不需要專用晶片依然能有成效 到時候再來跑也來得及 該恐慌的是那些投入大量資源搞AI軟體的公司
18
Re: [新聞] 去年12月總薪資平均近6.5萬刷新高 金飯15
[情報] 114年02月17日信用交易統計7
[心得] DeepReserch: 市值型 > 高股息10
Re: [請益] 台灣貿易順差超大 但為何台幣貶成這樣?7
[情報] 2032 新鋼 達注意標準 1月自結 0.0012
[情報] 00946 114/03/06 預估除息0.025元26
[情報] 3189景碩 113EPS 0.11(Q4 -0.55) 股利14
Re: [新聞] 首檔 ETF 分割來了!0050將重返發行價 49
[心得] 券商app年度回顧25
[情報] 2942京站 獨董彭振聲 因個人生涯規劃辭任11
[情報] 5864 致和證 113年EPS 1.98 股利 0.4+0.87
[情報] 8028 昇陽半導體1月自結0.431
[情報] 114/02/17 八大公股銀行買賣超排行1
[情報] 0217 上市櫃股票週轉率排行3
Re: [新聞] 川普「對等關稅」預計4月2日上路衝擊歐日1
[情報] 0217 上市櫃外資投信買超金額排行