[情報] 50美元訓練出媲美DeepSeek R1
標題:
李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型
來源:
Futu
網址:
內文:
李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSeek的R1等尖端推理模型類似。研究人員表示,s1是通過蒸餾法由谷歌推理模型Gemini 2.0 Flash Thinking Experimental提煉出來的。
https://i.imgur.com/kFg9GjU.jpeg

斯坦福大學以及華盛頓大學的研究團隊展示了一種極低成本的 AI 訓練方法,被稱為 S1。
S1 僅使用 6 美元就能達到 OpenAI o1-preview 級別的推理性能!同時匹敵Deepseek R1
推理時間可控:S1 通過簡單的“Wait”機制,控制大模型的思考時間,提高推理能力。
S1 不是 OpenAI o1 或 DeepSeek R1 的直接復刻,但它揭示了在推理時微調 AI 的潛力,甚至可以媲美 Reinforcement Learning(強化學習)。
OpenAI 和 DeepSeek 早期研究發現,AI 在回答問題時“思考得更久”,往往能得出更好
的答案。但過去並沒有清楚解釋:如何在推理階段控制 AI 的思考時間?
S1 的創新點: S1 論文提供了推理時間擴展(Inference Scaling)的具體實現方法:
核心思想:
如何在不改變 AI 訓練過程的情況下,提高 AI 解決複雜問題的能力?
方法:讓 AI 在推理時“多想幾秒”,自動檢查自己的答案,從而減少錯誤,提高正確率
!
結果證明,這種方法比 OpenAI o1-preview 還要好!
最重要的是:而且只用了 1000 道題! 這比一般 AI 訓練的數據少了 800 倍,但效果仍然很強!
此外,該模型可以在筆記本電腦上運行,並且其訓練成本僅為 6 美元。
論文下載
https://arxiv.org/pdf/2501.19393
--
好便宜!!!

?
不用錢,我的腦就是R1
完了 地動山搖
R1很強
Gamini 2.0不是剛出不到一天
提煉再提煉
你肥肥團隊
哈哈 過一陣子 會不會出現0.5美元就可以搞定
變伏特加了吧這個
這啥 白菜價? 韭菜價?
多想幾秒鐘 你可以不要...
AI白菜價
openai又要發作了嗎
真的白菜價了
要遍地AI了
那誰要當第一個訓練的?
然後發現 這AI我根本很少用到啊
丸子 沒有最便宜 只有更便宜 ㄟ唉末日
這很常見…不用大驚小怪
結果最後大家都去別人的水桶裡面釣魚耶 笑死
丸子 原來搞AI那麼便宜
以後沒人想開源了 大家自己買nv晶片訓練大模型
太唬爛了,能信嗎
卷爛
你釣他水桶裡的魚,我釣你水桶裡的魚,大隊接力
看來ai普及速度極快,終端裝置準備大噴發QQ
看不懂
NV我們不要了
你蒸餾我的蒸餾 近親繁殖?
蹦蹦
50鎂有點太唬爛了
阿不就是都在巨頭開發模型基礎上才做得出來
NV又要一根了嗎?
這應該算微調嗎
gemini :我的魚!!!!
連顯卡都不用
多想幾秒 連線請教GPT
NV利空
轉包的概念 cc
NV又要崩崩 TSM崩崩崩
崩
第一個訓練的都低能兒
麥當勞工讀生一天都不只要50鎂
蒸餾你的蒸餾的蒸餾的蒸餾的蒸餾
直接蒸餾別人的模型沒有版權問題嗎?
越來越吹越來越騙,超白吃的哈哈哈
工程進步本來就是一直站在前人肩膀上往上一點一點爬
50美元我看是員工上廁所的錢
真的筆電手機可以跑崩個毛線,超級換機潮要來了
雲計算.....
自己人說好不打自己人
喜迎換機潮
蒸餾來蒸餾去,啊誰要當花錢的人呢?
甲甲越想越不對
NV掰
蒸餾Gemini 那答案到底會多爛..
ds崩潰 @v@
李飛飛是美國國家工程學會院士超強
可以的吧
急了嗎
這個核心是Edge AI應用端啊 推理端負責第一個花錢
下次剩5毛了
用AI來訓練AI的概念????????????
卷起來
翻譯成史丹佛大學比較多人知道
白菜價AI
三思而後行的體現
成本是這樣算的嗎~~ 越來越唬爛了
李飛飛是美國公民從小就移民美國了
改天就會進步到無料訓練
Ai要變成熟製程了
蒸餾
Gemini 很智障,蒸餾錯誤了
前面花錢的都白癡
也是要靠蒸餾 人家模型不給你用 是要省到哪
看那些巨頭怎麼回收 訓練越來越便宜
開捲囉~~~
99%蒸餾難度最高 可能要花大錢
香
以後只要釣別人水桶內的好魚就好了 那誰要當漁翁?
崩崩崩
捲起來 軟體快沒毛利了
(只有更便宜,)(沒有最便宜!)(嘻嘻。)
多想幾秒 大賺百美
意料中的事
越來越扯了
Gemini2.0 很智障,蒸餾失敗吧,要蒸也要GPT
4090 50收
幹成白菜價
站在巨巨的巨巨的肩膀上,指數型成長
好了啦
丸子,AI要變成白菜價了QQ
削價競爭
笑死 以後大家都用蒸餾法從別人模型裡學習
蒸出來取好的精煉也算效率提升吧(?
人工智慧(x)人工智障(o)
這樣誰要當第一個 XDD 你蒸餾我的蒸餾
筆電一台6美元? 到底在公三小
已經有冤大頭當了啊XDD
以後誰要?不需要啦
他是刷出租雲端空間跑的
嗯大地震要來了嗎?
笑死 錢都花巨頭的 其他蒸餾就好用啦 巨頭們:乾
大AI時代?
50美元可以那根本不須硬體 再多公司投入也沒用
卷了
大蒸餾比賽開打
越來越扯
大躍進時大家都這樣玩啊,你畝產千斤我畝產萬斤
這應該就蒸餾然後在限定領域
是誰搬走了我的魚
AI煉金術士 2.0 哈哈
那最近這波中國半導體噴漲要掰了吧,不是只有Deeps
eek 做得到
大蒸餾時代
所以說開放api這條路應該要斷了吧
AI模型多元宇宙
突然想到蒸兩手之后 openai是不是告不到了
越來越唬爛了,相對論是憑空出現的嗎..
跟以前盜版光碟一樣 總要發明防拷技術
不給專利誘因那誰要搞技術,通通回去種田
這次熔斷嗎
如果不開源 大家就只需按個按鈕切到別的模型去
這個沒有蒸兩手啊?
大家都站在別人的肩膀 那誰要在地上
看錯了 我以為是蒸DS
生命之水
啊重點就是這些科技巨頭已經在地上了啊XD
不需要開源啊 事實上大家都沒錢訓練 以後都不給蒸
餾 等防拷技術出來再說
這是美國自己研發總不能說因為國安不能用吧
方向很明確了,大家要玩成本降低,nv 下去
要怎麼證明是用誰的模型蒸餾呢?
NV只會更強 如果要靠蒸餾 只能說吃屎
謝謝你 矽谷銀彈
都不用設備了,大科技蒸餾大科技
不靠蒸餾就能降低成本 NV才會下去
丸子 蒸的丸子
防拷應該蠻難的
看了一下論文 其實哪有那麼便宜 你還要拿GPU來微調
以後主權ai都鎖在自己國家實驗室 不給蒸餾
AI變白菜了
他是示範便宜的蒸餾過程成本 不用限定Gemini智障
都開源了想怎麼玩就怎麼玩
模型內容 還要從59K的問題中找到一千題來微調
講說點,就是用別人的AI加以開發...
要防蒸餾就是不讓外人使用 但也很難賺錢
對人類是大利多 對股民是... ?
以後巨頭不敢公開 花大錢別人隨便蒸餾XD
重點是不用太貴的GPU吧
還不是靠蒸餾
開源也只是開放現在gpt蒸餾出來的 等gpt-5出來 這
些還是得跪下
濃縮再濃縮
站在別人的肩膀前進
但openai最好想好gpt-5如何防拷再開放出來
巨頭就通通變成黑盒子 然後還要預防MEA攻擊
啊可是Gpt5出來明天就可以再蒸餾了XD
開源就很好用了... 你發展你的 消費者用不到那麼深
不然就是巨頭自己學會這些蒸餾法 只發布蒸餾好的
精粹再精粹
唯一的方法是搞出GPT5後還不給外面access 但這樣要
玩個雞毛
又是中國!李飛飛
跟以前ps2盜版光碟猖獗一下 接下來就是考驗專利和
防拷技術了
學一個智障有啥用
Openai快變open醬了 被打趴
準備崩崩 那些吹AI伺服器的都反應完惹
開源只要一打開美國研究機構一堆天才一定玩的比DS更
現在就一直蒸餾你的蒸餾嗎
猛的
你發佈蒸餾版也沒用啊 input output能學就能蒸餾
那就蒸餾你的蒸餾 防不了吧
要獲利還是要靠閉源吧 哈哈 開源推動的是硬體 但對
軟體開發沒幫助 直接讓市場健康不良
沒救 只能像以前google統統關在小黑屋裡
最後王者還是要硬體的
李飛飛也算大神級人物吧!
偶爾放他出來下圍棋秀一下肌肉
秀太多次就會被蒸餾QQ
人手內建AI模型 下一步就民間各自特化模型在賣了
使用 16 NVIDIA H100 GPUs with PyTorc 26分鐘微調
吹吧,越吹越買NV
你蒸餾我的蒸餾!?
李飛飛是美國三個大型學會院士當然神,華裔美國人之
這個是訓練解單一類型題目而已
神阿
軟硬體結合才能防蒸餾防拷啊
蒸餾不稀奇 現在是要成本越低越有人看484 qq
現在大家都來當卡卡西?
在一個月就免費訓練了
唯一獲利的方法是搞出AGI ASI 然後直接毀滅世界 不
然永遠有辦法被蒸餾模仿 誰先做誰傻逼
以後模型盈利看來只在嵌入式機器裡面了 不給蒸餾
這樣對市場好像不太好欸 那誰要回饋給花大錢訓練的
?
笑死
邰哥表示 : 提煉再提煉,濃縮再濃縮,才來精緻完成
他重點是說要從大模型裡面榨出自己需要的各種專門AI
可以很便宜
Siri助理一問一答有沒有辦法蒸餾? 我看是很難
沒有大模型先做訓練也沒辦法蒸餾,大家都只想收割
不想播種,ai發展就會停滯了
蒸餾你的蒸餾 後面費用本來就低吧
要浪費太多時間去問
50美元,我也來開AI公司
我提煉你的提煉
看一下現在deepseek卡住的樣子呵呵
就說openai 只有在搞到新聞想要燒錢做出agi 狂人科
學家
卷卷卷
不用就不用花錢 選我正解
在資本主義的股票市場 對人類有利多的通常都...
貓咪釣魚.gif
再騙我阿 誰說一定要買高級鏟子
意思就是誰當第一個誰白癡?
不過這就跟arm公版cpu我直接照抄去做 還是要付專利
一樣
以後法規成熟才能規範吧 現在就互相蒸餾 蠻好笑的
看以後有沒有專利收費 老美被搞太不爽應該會立案
NV表示:
提煉再提煉 濃縮再濃縮
丸子
開始捲了
這樣誰會當盤子 弄出來給人家蒸餾XD
看哪天誰開始擋蒸餾 後面改版一次換一次就好笑了
這樣子便宜的白菜價 真爛大街~~~
再捲下去過兩天天網就生成了
Arm也是啊 我憑什麼要付專利授權 就抄著做 最後還
是被搞的要專利授權費
你不提出AGI就是直接被卷死了
來了
這超連結過去而已吧
這樣誰還要訂閱open ai
輝達 嘣嘣嘣~
好了 NV下去
就那個內捲大國會有人願意吧 習慣互卷了
提煉再提煉 濃縮再濃縮
消息一出 NV要噴了 之後都是擋蒸餾 只能靠自己訓練
了 噴噴
(請問有人)(用黃金鏟子)(鏟黃金嗎?)
(用鐵鏟子)(就可以了!)
算力需求不只訓練吧? 推論也是
(也可以)(用手和河水)(淘金啊!嘻嘻。)
這是技術太快跑在法規前面 之後就是專利戰
本來只要AI學少走彎路,現在AI(算法)學會自己生捷徑
ds吹得飛起然後卡爆 你繼續
等專利戰完之後就是授權費保護了
就股價來說很慘 但你換個角度 如果開源資料俯拾即是
真AI時代的來臨會加速 人類科技樹會點更快 新產業
也會誕生
泡泡要破了
提出一個方法證明可以較快 馬上破壞市場
1月的paper嚕
成本都給別人自己就不用成本了 天才
模型C站也是這樣吧?
又要崩了嗎
再卷下去就要變成白菜啦
那也可以推論oprn AI可能也不是AGI的解法了XDD
只在有明確答案的數學問題上有用
釣別人水桶裡的魚不用500萬美金 50塊就夠了
現在流行拿鐵鏟子去挖別人桶裡的金礦
鏟子丟啦!難怪公公被大賣
所以說讓中國做一個超過gpt-4的有沒有可能? 不可
能因為得等openai先出
之後變成5美元
美國自己的權威研究單位都在卷很難擋
我預測NV今天崩50趴 1個禮拜之內崩到2塊
50美XDDD笑死了XDDD
幹別人的研究成果然後說自己不用花前期伺服器建置
成本 站在巨人的肩膀上 說自己成本超低
那就不用擔心 因為最先端的 老美一定都自己藏起來
用
這樣下去沒人會投入資源去訓練阿 很麻煩的
現在主要是大家都開源 你自己單獨公司再努力也比不
上開源
NV昨天才彈起乃 又要躺下去
問題是open ai超越啥了QQ
我的視野跟巨人一樣高一樣遠
證明LLM可行性 但是成本太高
啊問題是這些軟硬體巨頭砸一堆錢就是幻想可以當人
上人
開源沒屁用啦 開源只能優化算法 但無法解決算力不
足的問題
美股又要崩崩了嗎www
聰明的就讓運算設備給白癡去買
問題是你巨人再長高阿 自己不長高怪別人追上來
盤前沒動啊,不怕不怕
現在開源方案直接打到幾乎同校力,還便宜到掉渣
結果現在看起來要偷模型完全擋不住
Ai 要變成熟透製成
XD
其實很合理吧 , 人類世界也是大家都站在巨人肩膀
喔
模型跟算力都被免費仔偷 慘喔
蒸餾^2??下次就是蒸餾^3
50美元是怎樣,跑訓練的電費嗎
沒有openAI前面花這麼多錢,你DS跟後面的競爭者哪
有辦法這樣子
50美金是雲計算費用 一堆文盲嗎
盤前要動個屁 上禮拜史丹佛研究生30塊就重現了
現在就是你獨自創造 這麼貴 然後人家便宜直接收割
prompt 很常用,但我覺得拿來訓練效果有限
以後可能變成0.5美了 無限蒸餾之術
就租幾組H100 1小時 謝謝你的模型欸嘿
最近open老大去世界各地拉替死鬼 幫QQ
你給中國顯卡 可能ai都天緣突破了XDD
美國放大量AI顯卡給中國 可能直接天元突破ㄌ
現在不是煉金術了 是蒸餾術的年代
捲到死!!!
人類也不會從頭到尾都自己研究 發明一遍 換成ai
幹你嗎的
咦
不這樣做才挺奇怪的 @n@a
中國複製貼上從1~100的卷法 就跟scaling law一樣
啊
你前面投資都還沒找到回收方案 人家已經追上來了
每個人都comparable 每個人都低成本 大吹牛時代
你訓練我的訓練的他的訓練
ai最後要變成無法回收成本的投資嗎?
後面會不會出現偶蒸餾你的蒸餾 越來越便宜
重點在於產出的東西 有沒有效率 準不準確 好不好用
這三洨 不是唬爛的話是要賣菜刀的去死嗎?
前期投資者真的哭死
來了來了ai大戰
笑死 這是在反諷DS吧
唬爛過頭
笑死 50 連乞丐都做得出來
沒有那麼多h100 都可以當市場毀滅者
哇靠 這等於不用錢一樣
晶片跟AI股又慘了
什麼時候可以用一杯珍奶的價錢訓練出一個model
搞得 AI跟垃圾一樣 滿地都是
你以為鎖起來逼別人重複造輪就贏了 實際上還是會有
人偷出來卷你 你根本擋不住
那給中國算力更強的顯卡 直接低成本卷死AI世界了吧
自問自答可以提升訓練效率的意思
好喔 然後?
「雲計算」
那些自以為算力天下第一的 最後還不是要被人家收割
除非你能用國家安全為由 不准別人蒸餾模型@@a
被抓到就關起來@n@
開捲 中國鑽進去的行業注定爛掉
可是別的國家一定會想竟辦法偷,除非網路都不連@@a
你花一堆錢買算力 好不容易訓練出來 人家直接低成本
越來越符合openAI當初的設定 非營利組織
蒸餾 屌打你
抓到就關起來 但不給你抓(O
不愧是elon musk 真有遠見
下一篇 50越南盾
按照目前這種進度 我看ai真的要變成公益性質啦
不是已經不用錢了嗎?XD
這種東西拿來發paper看起來會很猛,但商用一定會跟d
eepseek一樣遇到一堆法律問題,搞不好類似方法最後
還會被google捧回去開發新模型
美吹殖人沒看到這次是美國自己幹的 割七巨頭這個大
韭菜 狠多囉www
這94所謂的AI精華液嗎 ??
哪有 伊隆馬砸了一堆錢在grok上
那川普還要搞什麼5000億Stargate嗎?
你算力很強? 有蒸餾省錢嗎?
我是指用戶端 不用錢啦
以後拼多多,幾毛就能訓練出AI還包郵
當初OPENAI就是elon musk成立的阿 目標開源非營利
壞了五十收
她就是goolge前副總裁兼首席科學家啊,根本一家人好
嗎
結果被現在CEO搞成close AI
我都請時薪200的坐在裡面
捲到你變成公益ai
我蒸餾你蒸餾的蒸餾
不過應用上chatGTP更好用
(卷哥!)(卷姐!)
問題勢必要每個用戶端 都去蒸餾一個模型嗎?
蒸餾法是啥?
謝謝大家的錢錢 前人種樹 後人乘涼
川普發現自己的研究團隊也做出便宜AI更喜歡啊
前有DS開源高性能 後有人家花50鎂直接拿需要的模型

自己玩 喔 50鎂搞不好也是用免費租用換到的 笑死惹w
ww
*有必要?
算力用租的就好了 訓練完我們就不要了 NV掰掰
人人有ai 那美國真的只能靠三戰當霸主了嗎QQ
到時候各國都有自己的ai @@a
算力需求低 邊緣運算產業鏈要起飛了吧
因為這種東西 正常來說不會允許被別國掌控
主要是現在ai沒有賺錢手段 成本無法回收 還沒回收成
本就開始卷低價
現在就是炒手機PC換機潮阿
反正只要蒸餾在自己改一改就堪用了@n@a
話說這是幾天前的東西了
NV回老本行改賣顯卡啊 大家都玩AI就這樣 安啦
花大錢堆顯卡預訓練大模型的公司表示:操
現在就在漲機器人跟工業電腦了
等於你花錢訓練ai真的是在做慈善
真的傻傻各位 利用別人花大錢的成果 太強了
賽鴿 你要自己蒸餾一個AI問她去哪喝茶比較安全便宜?
洪水療法 大家都來低價AI 讓NV重返榮耀
美國政府不會反對自己人在卷啦,資本主義就這樣
比手速了 XD
來看看這次要怎麼防堵啊 國安問題又要上場囉啊?www
你信?
硬體成本都不用算就對了
我蒸餾你的蒸餾他的蒸餾全部蒸餾
因為是用租的 可能只租兩小時
真假= =?
這次美國自己人發明的還要國安糖漿?
要什麼硬體成本 他直接租幾小時就完事了
對~矽谷的人都是白癡
改天手機眼鏡手錶都可以跑,大換機潮要來了
AMD利多?
免費版AI 公用版AI 專業版AI
應該有人開始抓想要的套在各種產品上了 抓穩囉
以後的AI手機跟PC如果能本地端單機訓練特化需求的AI
就真的屌 學歷也會貶值 變成認證制 因為大部分知識
你在家跟AI學就好了 學校變成是交朋友兼托兒所
以後就是大我蒸餾你的蒸餾時代
三次蒸餾,愛爾蘭威士忌嗎
人類的知識發展快要被機器學完了
你各位 之前示範過一次了~ 現在應該知道了吧
蒸餾你的蒸餾
好想看矽谷+華爾街全線崩潰
看來真正的AGI來臨前會先被卷死或是嚴重拖延 梁文峰
說五年內會有AGI誕生太樂觀了
以後直接發明電子腦輔助工具哪裡需要學習
為啥會全面崩潰?不就堆算力崩潰而已 公司這麼多又要
不是只有ai算力
文雅一點的講法就是參考隔壁同學答案
丸了
就駭客任務那樣 知識直接下載嗎
好啊 你開放你的API 比deepseek便宜算你贏
會不會背後有一堆人在聊天XD
agi看起來需要公益慈善才做的出來阿
粗暴點的說法就是釣你水桶的魚XD
真的扯 卷到股價不值錢
大便AI蒸餾會變宿便AI嗎?
AGI 跟這種狹義的AI 是完全不同的世界
AI股看來要爆跌再爆跌了
用租的 哈哈哈哈哈哈 中國在會卷也想不到有這招吧
完惹 NV崩
訓練出AGI不也是能蒸餾一下帶走嗎?
所以現實是資本主義美國人更愛捲
XDD 沒用的 而且出人命誰要負責
放心了 一堆人看崩 今天該加碼了
先發酵一個月才會有反應
s1看起來概念很簡單,就是你準備要射了,就wait,再
抽差幾下,再推理,再wait,再推理,弄幾次才準你射
。
感覺人類知識應該在三年內會被ai學完 之後就是ai產
生知識給人類了
AI該不會要血崩了吧
夜盤沒有崩 表示市場沒在怕
gemini那麼爛 蒸餾他可以媲美openai?
你敢蒸餾我的蒸餾 波特?
我也覺得 gemini 不好用
太卷了吧
現在不準沒關係啊 反正會持續研究要怎麼蒸餾性價比
最高 嘻嘻 還是遠遠小於七巨頭的成本
s1都出來三天了拜託 崩屁啊崩
nv崩
https://i.imgur.com/6HDSJmz.jpeg 我看到的是6美

元
傻鳥需要引進這個 多想一下再發廢文
單純市場還沒完全理解吧 今年這氛圍遲早發酵
DS蒸餾技術是最好的 嘻嘻嘻嘻嘻
不用為NV 擔心,讓時間證明就好,很快就會回去了
盤子才當第一個 感謝openai的付出
李飛飛學界很有名,應該不是唬爛吧
NV崩潰
這樣誰要當第一個啊
現在市場還沒反應吧 當初DS也是過了幾個月才爆紅 那
時候也是少數人知道DS開創新的路徑
成本下降會引來對算力需求的大爆發 抓穩了
其實就是openai進步的不夠快 @@a
算力過剩 讓closeAI去當SB就好
建立在前人的基礎上說成本多低都是假的,我高中就
學會一堆牛頓運動定律的應用了,牛頓還要搞到4X歲
才發表,這代表我比牛頓聰明,花的時間更少?
你蒸餾我 我蒸餾你 以後誰想第一個砸大錢……
openAI當初自己做死自己要怪誰
卷
知識發現成本高 學習成本低 本來就是這樣@n@a
科學本來就是踩在巨人肩膀上進步的
不然你要自己從頭再做實驗推導一次萬有引力嗎 @n@?
破盤價
拜託下來讓我上車
不準用牛頓發明的定律,用了我就要打你抓你@n@?
蒸餾大賽開始
重複造輪的事情就交給AI跟機器人 直到AGI實現
你就算要訂法律 ai不準蒸餾也能限制自己國家的@n@
別的國家誰理你@n@?
蒸餾再蒸餾 精煉再精鍊
美國輸定了 看了真爽www
有夠捲XDDDDDD
壓縮再壓縮 提煉再提煉
李飛飛,這就不可能是吹牛的了
美國不會輸但是openAI肯定完蛋
closeAI應該撐不久了 其他CSP廠沒差
美國輸定了?李飛飛是美國人欸...?
蒸餾模型正夯
越來越扯
這玩法應該是擋不住了 你只能限制自己國家的對手
以前讀李飛飛論文 就只是包裝的很好 但沒啥用
SamAlt 會自己跳出來,我捲自己更大力給你看
如果真的好用為什麼不花個500鎂訓練?
下一波AI手機準備大爆炸
谷歌的AI系統也是李飛飛做的阿
大概UC Berkley一個月前就出花450鎂訓練的論文
tsm要打成不良品了
比分數輸了?
NV: 吼 你們不要這樣子啦
開卷
便宜治百病
作弊不就你抄我 我抄你最後答案都一樣
你也蒸餾 我也蒸餾 大家都是一樣的
笑死 根本公開嘲諷DS 用租的就贏DS了
好可憐 OpenAI被整碗端走
笑死做研究與大規模完全不一樣
以後都玩精煉數安術就好 大精鍊時代 做基礎資料都是
白痴 大公司不要弄了
還是得要有創新的東西吧
GG高階晶片怎麼辦,要變雞蛋價格了
李飛飛是google副總裁跟首席科學家 用google成果
還好啦
抱歉更正,查完成績。UC Berkley的模型比較弱
好像有點東西。
像極了t1姑媽 蛋雕
以後全人類都能用上便宜AI了
現在不用擔心ai會取代人類了
沒人想當第一個了。結束
白菜價要來了嗎
ai整個白菜價了!!!!
白菜都沒那麼便宜
雞 雞精 滴雞精
NV不用買了(?)
吹牛吹成這樣
急!!求現在在用200鎂的內心陰影面積
下一篇:只要3美元
以後去逛夜市會看到有人賣LLM嗎
去別人的水桶釣魚當然很容易
最早的智慧手機也不是蘋果發明,不是第一就是贏家
蒸餾到後面會不會沒東西
五次蒸餾 變成伏特加
DS其實不是蒸餾,這個才是真蒸餾,DS那個降成本比
較有意義
蒸餾只會蒸出個差不多的,並不會提升AI整體的能力
蒸餾蒸餾再蒸餾
這個其實有提升,用了這個wait機制後比被蒸餾的模
型準確
現在最恐怖的是一般大眾不需要高算力設備 就連大企
業和研究設施搞不好也不需要 讓七巨頭繼續當七冤頭
??
幹 再吹啊 下次變5元台幣
那可以用SLM的成本做出LLM的效果了嗎
再過幾天 就有零成本的
應該是DS加上這個做模型會非常便宜
直接用別人資料庫(O)
給我時薪40美元,丟問題給我,我可以幫你問Chatgpt
任何
(要比卷,)(誰能贏對面?)(嘻嘻!)
笑了~六美元是只算電費喔XD
七巨頭買GPU要用來訓練還是推理都可以
看其他網站gemini 2.0 Flash math500 是90 GPQA是59
需求不會降低,其他家的顯卡免費送也對NV沒有競爭
下次一元訓練
力,就讓時間證明吧。
50塊就可玩?
她用Qwen當base model加上wait機制就贏gemini?
以後就是開發AI,AI還會先轉帳給你錢了
用ai寫ai
fine tuning 好嗎 論文附了自己沒看?
差不多是以前網際網路從貝爾實驗室到突然每個人家
裡一台14.4Kbps數據機的轉變
吹牛大賽 開始
中國又贏了 (疑?)
蒸餾對吧,推薦這部

大家請補貼捕魚人
蒸餾技術早就有了,只是Deepseek首先公開不要臉地
使用還當作自己的成就,相當符合中國人
可以預期雲端伺服器租金會有不小提升
DS是用算法實打實的降成本哦,不是蒸餾
李飛飛是真的很神
任何人有50美元都能來碗大模型
不是蒸餾那你說說看他是用算法降哪裡的成本?
好可憐啊 還有人在造謠DS是蒸餾 你怎麼不把同樣的問
題的去問DS和gpt 啊 看看回答內容就知道是不是蒸餾
囉www
軟體股利多
太強了 你的國
蒸餾後加個自己的算法就能算是自創?
所以今晚跌多少??
就很多人問過了,連Deepseek自己都回答是了
阿貓阿狗都出來了
看來有人搞不懂蒸餾的意義呢www
其實這個並沒有比較厲害,但不管怎麼樣這波都是開源
的贏,除非閉源能搞出新花招跟新數據,要不然在現有
數據使用完的情況下,開源會一直有優勢,呵呵!
接下來訓練出模型沒有倒賺還花錢的都不是個咖了
DS確實不錯就是吹過頭
中國的東西都是這樣
??真的假的
所以以前都在配合矽谷跟華爾街的炒股故事不公開嗎XD
用別人的訓練資料,然後說很便宜…這是偷吧,如果
這合法,誰要當第一個花大錢訓練的冤大頭。
既然中國已經先捅破窗戶紙 美國這邊也不用裝了

看中文摘要,用挑過的訓練資料才那麼便宜
居然還有人不知道DeepSeek說自己是CHATGPT
可怕,台股又要崩盤了嗎QQ
1000題目微調是要多少錢 合理 AI不值錢了

OpenAI也偷,有人是不懂哪來那麼多數據喔?你以為數
據都沒有版權嗎?搞大語言模型的很多都心照不宣,另
外數據集也有開源的,不懂的就以為什麼都偷,笑死!
我蒸餾你的蒸餾
尤其幾乎全部AI算圖模型都是小偷,拿別人的版權圖片
照片算出來的,呵呵!
多想幾秒就可以便宜這麼多=.=?
這訓練了個寂寞
阿不就偷人家訓練完的數據而已
不要什麼東西都亂扯一通
哇喔要捲爆了吧
史丹佛好不好
自己去看看那些算圖AI的產品,一眼望去到處是別人風
格的畫作跟照片,就知道那些訓練材料是怎麼來的了,
呵呵!
gemini補習班 教了考試技巧 分配時間+檢查
Ai越來越cheap惹
AI的進展越來越快了 人類也就
爽,多來點,戳破美國的AI的泡沫
我蒸餾你的蒸餾
酸酸繼續說偷,結果OpenAI等閉源公司也在偷,偷開源
技術來用,假如你閉源公司不讓別人用卻要用別人的技
術,遲早會搞出GNU授權,到時候閉源就都別用呀!笑
死!
越來越便宜
提煉再提煉 濃縮再濃縮
成本根本亂算 訓練原始模型不用錢啊
然後莫忘DS吹說幾百萬 新加坡偷買77億
這跟智慧型手機的發展很像啊 接下來就看下一個蘋果
蒸餾永動機
16塊h100跑半小時 用租的
人家佛心開源用MIT授權讓你發展人類的AI技術,閉源
低調用就好,要鬧事搞到浮上檯面用GNU授權,直接代
崩爛
碼污染把你變開源,人家Altman也不是笨蛋好嗎?呵呵
OpenAI GG
!
什麼妳說NV會跌到50
樓下支援釣魚統桶貓的圖
丸了,晚上美股又要蹦了
釣魚大賽,看前面是誰的水桶

開始卷了,下一個不用五美元
今天NV要幾%
哇操 好猛
又有甜甜價可撿囉
趕快上線免費AI服務吧
好啦好啦通通泡沫化啦
筆電就可以,6塊的成本是?
要崩了嗎
這次誰再沒上NV車就是___
李飛飛真的神

崩
AI遊蕩彈藥
我提煉你的提煉
就像這位老哥說的,吸籌罷了。如果華爾街這次還沒
買爽就會再下去,反之就沒反應
跳蚤上的跳蚤上的跳蚤
會不會到時候模型互相開始對話
站在巨人的肩膀
丸
就是一個理智的回答而已 有甚麼好高潮
是在低能啥小 電費都超過50美
釣水桶裡的魚效率不錯喔
OpenAi又中槍了
好 準備變槽灰搭
一個比一個唬爛 。遲早靠專利回收啊
下次是不是1美元就可以了
NV又要漲了 AI需求大提升 每個人都在用AI
山寨大國大逆襲了
大家都在蹭熱度xdd 事實證明NV根本不需要賣那麼多就
夠用了
多一點這種芭樂消息 懂的人自然會繼續爽爽低接
笑死 繼續吹
AI大飛耀
下一篇5分錢
(本來是)(高級料理,)(現在要變成)(平民小吃
了!)
(某族群崩潰!)(嘻嘻。)
笑死 就是盜別人的再說自己的 非常便宜欸
一堆不懂的在推文也可以推到600多則xd
50美元指的是雲端計算訓練費
這種東西管NVDA屁事 看不懂 是不是一堆連內文都不看
的
就連線到gemini等答案啊
股板要變科技板了,整天PO AI的文章XD
幾大巨頭花大錢幫大家做前處理,中小型企業爽到了
有意義
誰當第一個誰是白痴,我蒸餾你的蒸餾
李飛飛不可能做只有等答案這種研究吧
只是站在巨人的肩膀上
慘,AI商轉沒多久就變白菜價
專利我猜就是AI會有個性,會從使用者對外的聊天方式
,找出使用者最喜歡的對話模式,簡單來說,就是網軍
跟詐騙在做的事
左腳踩右腳要飛了
大蒸餾時代來臨
飛飛
我會了!蒸餾再蒸餾+問AI確定正確嗎?
幹 超屌 反觀
李飛飛大概就龍母等級 養很多隻龍 懂?
AI 早就轉商了,只是台灣沒在用,連對岸都用ㄧ堆A
I
中又贏
這個李飛飛不是普通人,應該是真的
結果跌下神壇的是OpenAI 而不是輝達
太扯惹
操你妹的白癡新聞
幹NV一直漲欸,還以為能跌到一百以下,結果就這?我
還沒上車啊==
以後誰要當第一個開發的?都給人白嫖欸
OKLO 先崩一波
青鳥:蒸餾法不就抄襲!
DS不是蒸餾OpenAI的吧 畢竟OpenAI沒有開源啊 哪能
蒸餾?頂多可能謊報訓練成本
他們是不是對成本誤會了什麼?
方法:請他再想兩下
OPENAI有開放阿
你是不是對於蒸餾有誤會 蒸餾就是一個問一個答學習
而已 又不用代碼
窮人思維 唯一支持200億台灣之光AI麵線外送APP
這故事不就告訴你,大家互相蒸餾的結果就是算力大量
缺乏
有開源嗎?沒開源沒被檢視,看起來只是在吹而已
Andrej Karpathy就是李飛飛的學生
特斯拉的前FSD首席工程師
真的完蛋了 科技股崩爛
算力才是根本,繼續噴了啦
還不是抄襲
老黃哭爛、
成本亂算一通,負責組電腦的人要不要算成本?根本只
是為了壓低而都不算吧,吹牛也要有點邏輯吧
CS231n 就是李飛飛的課程 入門幾乎必看
明天電梯向
今天電梯向
李飛飛美國人啦==
gemini不是很爛嗎
居然有人不知道李飛飛
提煉再提煉XD
大家都繞過去就好了
銅板價AI
我以前養的鸚鵡叫小飛飛
ASIC炸裂
不是 這種前提是有一個強大的模型給你蒸餾啊 那個強
大模型是要成本的
沒聽過小李飛刀?
以後大咖都要關門自己玩了,沒模型可以幹了怎麼搞
最後會知道還不就那樣 好的就是好的 鳥的還是鳥
又是蒸餾法...看來open ai當了那個先鋒烈士...
除非open aiGPT5有很大的突破
果然是蒸蒸日上
李飛飛中國出生,所以也算中國贏
銅板價,很好!
有Nvidia GPU可以買,不會有人傻到買ASIC
GPU訓練就好,幹麻花大錢請肥貓還不一定成功
濃縮再濃縮 提煉再提煉
美國:我們的中國人比你們的中國人強
DS不是不用錢?
結論 老黃又贏 算力又贏
以後就不給民間私企蒸餾惹 只有政府軍方能用
我蒸餾你的蒸餾
真有趣讚讚
還不就是搞蒸餾這套
都提煉別人的
S1很頂 麻美 宇都宮 三上 河北
openai就在賣蒸餾服務了
跟iphone一樣 電錶倒轉
老黃的股票又要跌了,哈哈(反串註明
只有中國人才能互捲 其他人撐不住阿
噴
笑鼠!Ai又要快被捲爛
好像真的,原本用人工輸入訓練,現在用AI輸入訓練,
真的不用錢
就合成CoT數據而已
AI奇點要來了
好厲害
說中國成本大降的是虎爛 結果美國的更豪洨 50美元
說巨頭盤的 正因為這樣別人才是巨頭好嗎? 跟在別
人屁股後面的永遠都不會是巨頭
蒸餾你的蒸餾
嘖嘖 時代在進化
想要用蒸餾就得要有巨頭先驅
我相信傑文斯悖論
這篇文一定會製造出一波韭菜亂砍,嘻嘻
NVDA繼續跌
笑死 所以設備人力都不用錢?
好啊 大家都等開源來提煉就好了
誰要當鬼(第一名
第一個再拿最後一個跑會如何
Deep Seek 才剛剛被吹上天 現在跟我說只值5塊錢
蒸餾大便會得到大便界的王者?
成本不用算人力ㄇ
真的沒有很好用
蒸餾你的蒸餾
李飛飛不就中國人
33
基本上這是一個完全由美國本土的大學團隊成員 研究的成果,李飛飛是從小就移民美國的美國 人,本身是美國國家工程學會院士,如果這個也 算捲的話應該是美國人自己也在卷AI科技而且 還比之前的DS更狠,就看之後能不能提供上傳![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://img.youtube.com/vi/3O7b2HZCXKM/mqdefault.jpg)
47
好的 google 要不要把昨天財報上的說750億設備支出 變成50美元支出? 李飛飛能直接表明蒸餾Google Google 最好不知道還給你研究所蒸餾![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://img.youtube.com/vi/3O7b2HZCXKM/mqdefault.jpg)
9
大家都被訓練成本給迷惑 說穿了訓練AI就像培養人才 真正重點是"教材內容正確性",以及"學習成果的評價回饋" (就是老師要改作業) 對應的是"輸入資料正確性",並且存在"有效的回饋機制來修正權重" 資料部分雖然OpeAI/Gemini基本已經將網際網路上公開資料爬完9
讀完了 稍微整理一下這篇 這篇基本上就是#1dccCRfj 就是CoT synthetic dataset 透過母體大模型去設計一連串思考問題(這邊是用Gemini) 來應對一個困難任務 而此時新模型能更好地學會思考 這篇文章列了好幾個synthetic dataset的樣板![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://i.ibb.co/7dS1fSnD/Screen-Shot-2025-02-06-at-9-38-26-AM.png)
23
連結或內文,完全是錯的。 根本是腦殘媒體在亂寫。與論文事實不符。 先說論文結論: 模型表現: 經過不斷的做實驗試錯,![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://img.youtube.com/vi/yD5Zdk79X68/mqdefault.jpg)
這位大大 你真的很喜歡批評別人耶 這篇示範的是synthetic dataset disillation概念 為何叫做是dislillation是因為用大模型的知識去創作出的數據集 還推說這是這篇作者自己捏造蒸留定義 學術圈沒人這樣做... 這樣很不好耶...這明明就是一個正統的學術圈常用詞![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://huggingface.co/blog/assets/open-r1/thumbnails.png)
2
我的信息源說是1000個樣本是通過gemini得到,但是又以通義千問為基底模型進行監督微調而來的神奇表現 包括全球很多類似路綫都是藉鑒通義千問才能達到這樣的驚人效果,非李飛飛一家做到 這才是最奇怪的。 今日鼓點:大A乘風直上,就像哪吒2的票房 ※ 引述《DrTech (竹科管理處網軍研發人員)》之銘言:![Re: [情報] 50美元訓練出媲美DeepSeek R1 Re: [情報] 50美元訓練出媲美DeepSeek R1](https://img.youtube.com/vi/Run03PWXGBc/mqdefault.jpg)
68
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模更新: 年初一大新聞 美國上市公司(NET)、CDN市佔80%的 Cloudflare 宣佈引入 Deepseek R1 模型至他們的 serverless GPUs 產品 Workers AI 中![Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模 Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模](https://i.imgur.com/rDAhYVDb.png)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
50
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據OpenAPI 的 Chief Research Officer (首席研究員) Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/A73X07xb.png)
40
Re: [閒聊] DeepSeek是不是真的很強?這串一堆外行 首先 DeepSeek模型特點是 1. 訓練成本低 2. 推理成本低 先說訓練成本低30
[情報] 馮驥:DeepSeek是國運級的科技成果大推DeepSeek 「黑悟空」製作人:國運級別的科技成果 中國大陸AI新創公司DeepSeek發表的DeepSeek-V3及DeepSeek-R1兩款大模型近期受到大量關 注,連《黑神話:悟空》的製作人馮驥也發文大力推薦,甚至稱DeepSeek可能是「國運級別 的科技成果」。![[情報] 馮驥:DeepSeek是國運級的科技成果 [情報] 馮驥:DeepSeek是國運級的科技成果](https://cdn2.ettoday.net/images/7808/e7808891.jpg)
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
11
Re: [心得] DeepSeek將是刺破本輪泡沫的那根釘子DeepSeek其實真正的創新在model的高效設計,其真正的關鍵在efficient MOE還有MLA設計 這其實是2024年初DeepSeek V2就發表的東西 R1是把這個高效model設計+O1推理模型的LLM+RL合併出來的效應 我覺得歐美廠商因為本錢大所以忽略了降本增效的飛輪效應,所以第二個推理模型反而是中 國公司出圈了,推理模型的Test Time Compute對模型效率的敏感性就非常強烈了,訓練中10
Re: [問卦] deepseek的天才少女不出來救場嗎?5 微軟CEO納德拉在電話會上強調,DeepSeek R1模型目前已可通過微軟的AI平台Azure AI Fou ndry和GitHub獲取,並且很快就能在Copilot+電腦上運行。納德拉稱DeepSeek“有一些真的 創新”,AI成本下降是趨勢:“縮放定律(Scaling Law)在預訓練和推理時間計算中不斷![Re: [問卦] deepseek的天才少女不出來救場嗎? Re: [問卦] deepseek的天才少女不出來救場嗎?](https://i.imgur.com/QqCGkqvb.jpeg)
59
[請益] 0056可以這樣操作嗎48
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://img.youtube.com/vi/H_suOWdYLq0/mqdefault.jpg)
34
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://i.imgur.com/maDWxU7b.jpg)
29
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性46
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐![Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐 Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐](https://img.youtube.com/vi/I2ntFpiFUtM/mqdefault.jpg)
20
Re: [新聞] 川普希望美國製造全球5成晶片 賴清德紐16
Re: [新聞] Fed主席大熱門哈塞特表態:下周應降息 預7
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性5
[情報] 2548 華固 10月營收 MoM 702% YoY 37447%![[情報] 2548 華固 10月營收 MoM 702% YoY 37447% [情報] 2548 華固 10月營收 MoM 702% YoY 37447%](https://i.meee.com.tw/gQ7aplg.png)
3
Re: [標的] 記憶體族群回檔 彎腰撿鑽石多1
Re: 00641R 富邦日本反1 小單多
[情報] 工紙族群多
[標的] 2454聯發科2330台積電 哪個好![[標的] 2454聯發科2330台積電 哪個好 [標的] 2454聯發科2330台積電 哪個好](https://i.imgur.com/TbK5aJcb.jpeg)
[請益] 第一金最近有什麼大事要發生嗎?
Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性![Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性 Re: [新聞] OpenAI危險了!DeepSeek正式發佈V3.2 性](https://i.imgur.com/4uwgTa3b.png)