Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援
※ 引述《WinNOKIA (海神)》之銘言:
: 1. DeepSeek創辦人梁文鋒,少年股神變AI大神
: 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦
: 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十
: 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。
: 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?
來看看大神Andrej Karpathy是怎麼評論的
Andrej Karpathy
https://i.imgur.com/WYEHc65.jpeg

首先要打臉的是第二點
DeepSeek告訴大家,他是利用2048片H800 GPU, 經過兩個月的時間,訓練出來的,訓練費用是550萬鎂
你訓練使用的GPU,可以當成設備成本,給之後的使用來做攤提,一片H80,一個小時租賃可以到2~3美元/小時
所以用兩個月來計算,確實符合550萬鎂的訓練成本
而幾乎所有AI 模型都是給你訓練成本,這點DeepSeek沒有不同
這也是為什麼Andrej Karpathy會說這是如同「笑話般的預算」 因為他是其他模型訓練的1/10~1/20的價格
對照財政部某官員在某財經網美下面被噴到刪留言的事情~嗯 我只能說有這種言論不意外
https://i.imgur.com/SviWZpc.jpeg

至於你說第一點幻方量化是少年股神變AI大神,因為人家本來就是做大數據的,是用大數據來炒股財富自由以後才來玩AI,順序不能搞錯
--
你這樣他們不喜歡
哼!Andrej有我們股神strlen及WTF5566等人了解AI嗎
正確
其實老黃也是作加速卡作到變大神 老賈也是作pc作到
變大神 蓋天也是作dos作到變大神(現在還有人知道do
s?
中國id 要來囉 他們不喜歡這篇
中國大躍進即視感,畝產萬斤糧,讓我們看下去…
我只能網路有這種言論不意外。畢竟我們財政部官員都是小丑貨色了 現在的台灣有清末義和團的氛圍了,主打一個神功護台、刀槍不入 什麼DeepSeek都是幻覺、妖物,嚇不倒我滴
他的本業 應該靠這波對沖Ai概念股又賺了一大筆
AI專家即將抵達戰場
不能回答8964就是廢物 懂?
中國或成最大贏家
對於工作內容就是產製中國的負面新聞的人來說的確是
廢物
確實炒股呀 放空輝達 放出自己弄的Ai消息 回補輝
達 退休 其他不重要了
AK去年底這篇也沒評論啥吧

他就照著DS發表的資訊告訴大家有這個東西而已
呵,畝產萬斤糧,信的人就信吧
它其實使用了相當數量的H100
他的結論是如果DS的講法屬實那可能AI不用那麼多資源
好奇幻方做空這樣有賺嗎?沒跌很深反彈又快
ds12月底發表的,發表前幾個月佈局直接被尬爆吧?
幫你補充一下,質疑DS成本的林宜敬不是財政部官員,
而是他X的數發部次長,這才可怕
跟目前在吵的東西沒衝突啊
不要洗了啦...
台灣的數發部次長是這種外行人,可以,這很台灣
繼續吹,呵呵
好了啦中國最牛逼 爽了沒
如果大陸首先提出AGI模型,那才是大震撼
臺灣人講cp值 要薪水幾百萬官員去挑戰民間年薪幾千
幾億人才 真有趣
幾十年前吹大煉鋼 人有多大膽 地有多大產的
要消費時講cp值 要工作時就看齊歐美了
地方 數字聽聽就好XD
目前都中國自己在吹居多,沒看到什麼名人在挺
以前都是美國割人韭菜,我不信幻方這次沒做空美股
割美韭菜,盤前科技股重挫的狀況下,盤中DS發表新
模型。能割就代表實力
也不用急 反正遲早會有人去驗證的
如果大買空單再當沖一定賺爛吧
幫補血..真實情況如何還能慢慢驗證
台灣千億數位部能點麵線, deepseek能吃嗎?
幻方公司前陣子剛好做空美股,記得有報導
義和團是台灣還是中國?有點耐心吧!慢慢看下去
真的越來越像義和團了
既然都開誠佈公 就等著有其他人去公測啦
真只要600萬鎂很多26科技公司就拿得出來了
看錯了沒報導,只有臆測幻方做空美股XDD
不過幻方本來就是對沖基金起家的,如果這波割美股韭
菜也是賺美國的錢繼續發展中國AI,嘻嘻
早就說成本都只是推測而已 乍看之下合理 跟超導體
當初大吹牛的時候一樣 也是一堆領域大神拿來引用叫
囂股價
如果deepseek真的這麼猛 反正也開源 小公司跟上玩
小Ai,大公司拆解成本訓練法後補上效率運算的模型後
又變回算力軍備競賽了
然後某族群幻想的擊潰鏟子上的義和團夢境還是沒有
實現
股版8卦化
信的建議趕快砸錢去陸股All in ,不要錯過機會..呵
這個比較像日清時 對大炮巨艦的戰術 後來大炮巨艦還
說個笑話 樹發布
是在造
畝產萬斤糧 呵呵
其實openai 講的成本包含訓練成本 我覺得這篇才是
亂講
樓上 你才是亂講 openai講的成本在哪?
目前美國那邊講的成本 的確都包含訓練沒錯
目前已知的 就是chatgpt3用了相當1萬片A100 14.8天
我有朋友在那間公司
的訓練時間
chatgpt 3.5以上全部沒公開
什麼朋友 哪家公司?
沒必要跟你交代
我問chatgpt都問不到 4以上的成本
你比他本人清楚嗎
你哪位?
唬爛
好了啦 中吹可以滾了
一開始說openai講的成本 被打爆 又說是朋友講的
openai自己就沒公開3.5以上的成本
你到底什麼朋友啦 阿特曼喔?
笑死 台灣只有點麵線 哪來的臉質疑別人
股價反彈代表市場過度反應 賣鏟子該賺還是得賺
這些中黑好可悲 笑死
管你造假不造假股票會漲就好
如果有作空的然後還一手大吹DS,一手打NV, TSM,會
被噴爆吧
顯然DS的訓練費用是特地領域,如果要再更多,多元
全面,長時間驗證運作,那預算肯定不夠。
媒體常常推波助瀾去誇大賺流量
樓上 你的顯然是怎麼來的?
DS怎麼做的論文都有寫
IBIZA 你也不用急著想反駁 市場跟那幾個巨頭比我們
了解
二十幾頁而以 看一下吧
所以meta不就動起來了
中國就定期找東西吹啊,吹完就沒下文了,什麼漢芯啊
、鴻蒙啊、三折機啊、六代機啊、7nm還被抓包其實透
過白手套買GG的,過陣子DS下場差不多
被打爆什麼啊? 就是美國那邊講的成本都包含訓練啊
被打爆什麼? 臉啊
chatgpt 4的訓練成本是多少?
講一下
笑死
前一篇就一堆人唬爛 這一篇又一個
什麼其他家都有公布 公布三小啦
這柵欄仔不是常常被打臉嗎XD
什麼其他家都有含什麼什麼
見鬼了
我知道你投了很多在AI軟體服務啦 但你也不用這麼急
馬斯克之前還說不搞AI呢
WTF56有點慘,一直拿超導體出來比較,我都不知道是
不是反串了
你是不是不會看英文媒體?
這傢伙跟風的話能聽你就輸了
could reach $7bn
這都是推論 好嗎?
早就去年的新聞了
這個不叫公布成本
對 都是去年的新聞 這個就不叫公布成本
這東西就開源大家都可以下載來玩玩 程式碼也放在那
邊 WTF56只能鬼打牆
“training” and inference
甚麼叫公布成本? ChatGPT 3用V100訓練34天 這個才叫
成本
他幹嘛跟你講喔 你什麼咖 笑死
對 training, 那到底是花了多少GPU時間?
笑死
現在大家討論的訓練費用 就是要這樣算啊 笑死
被打臉開始扯東扯西
meta有公布 xAi有公布
ChatGPT只公布到3 DS只公布到V3
誰被打臉很清楚
學會看英文吧 當中吹也太慘了吧
這種新聞叫有公布? 笑死我
Ds配nv最新晶片最強
反正現在來看他算力不夠才會扛不住 那些大佬昨天也
說了硬體該買還是要買 我就說巨頭不會在這節骨眼賭
節省支出 台積電就證明賭對了市場都你的
你去笑死沒差啊 過年吃年糕小心別噎到
可憐
腦殘一堆 真夠慘的
剛剛還說什麼朋友在那間公司
真的是這樣沒錯啊 哈哈 我跟我朋友都會看英文
有指標性球板網紅說好用,就真的是好用
你準備被義和團噓
可能是虛空朋友吧XD

中吹只會被打臉而已
成本這種東西過兩周就驗證出來了啦 目前風向根據是
演算法來看成本相較於目前巨頭極大優勢
台灣人一堆腦殘 水準真的滿差的
你那個又不是單一模型的訓練費用 是整間公司的不是
嗎
我只是要表達 歐美現在講的成本包含訓練 跟幻方公
布的條目不同而已
我沒有要討論哪個模型成本比較高還低
DS是針對單一模型的訓練成本來討論啊,但你背後ope
x要怎麼allocate誰知道
你講的跟我講的是不同東西
對對對 中國最便宜 最好 你真棒 遙遙領先 讚
義和團,蠻貼切的,神功護體
我在說歐美的成本 包含 訓練+inference,幻方的沒
有含訓練成本。你說的是 openai沒公布單一模型 幻
你要按照income ? utilization? consumptions ?
方有
DS好像只有公布模型訓練成本,初始成本好像沒看到
我講的訓練是pre-training + training,幻方的訓練
其實就是蒸餾
他們沒有pre-training + training,就是拿別人做好
的東西去distill而已
就沒辦法apple to apple啊 那openai meta也掏出來
馬上就戳破了
其實美國公司都沒在管成本 他們很有錢
原本成本怎樣不是他們主要的考量
你沒發現meta openai alphabet 都沒在這訓練成本議
題上面打轉嗎
最好沒在管成本啦 唬小也要有葛極限
就直接raise fund就好了 成本真的沒那麼重要
最好是成本不是最重要的 這麼大的資本支出邊際成本
非常重要好嗎
應該是說 他們跟中國團隊比 沒有這麼在意成本
越來越厲害了 成本不重要 請問您在那高就? 老闆不
計成本給你薪水嗎
看看川普 meta openai 花錢的方式吧
都公開資訊
沒錢坑殺孫正義就好
你覺得openai他們到現在為止花錢的方式 是在意成本
還是在意模型產出XD
在意成本的話就跟台灣依樣吧 只買得起五片做不起什
麼模型
老孫:又坑我QQ
中研院去套皮 模型說自己中國人
這裡不能說中國的好話
邊際成本是另外一回事,就算搞AI還是要在意邊際成
本的
不然Data center設備幹麻還開標案 就都用最頂的就
好啦
他們真的跟台灣人一樣在意成本 根本就不會有幾十萬
片gpu好嗎 我在台灣聽到的單位有5-10片就很屌了
成本當然重要啊 我講的是跟中國團隊的考量的先後順
序
沒歐美做模型出來哪裡有給他們distill的基準
訓練成本就跟訓練成本比
我們200億的花法 不像只有2億的窮鬼啊
邊際成本和總成本的區別,他們願意投資鉅額資本支
出是建立在邊際效益存在的情況
要多文盲才會拿總成本跟訓練成本比啊
大手大腳花錢背後是一堆財務模型好嗎
而做軟體應用的公司 你跑去美國租算力來訓練不行嗎
你買不到十萬片 又不表示你不能租算力做軟體應用
沒錯 他們背後有財務模型 所以才不用像中國公司那
樣這麼注意成本
deepseek是能點麵線來膩?
就像牙膏有Fab也有豬屎部門 上下游都想自己搞
綠粉氣到流淚
啊豬屎屋外包GG代工也是一種營利模式 有沒有要自己
投資買卡架起來 哪一個財務模型適合你的商業模式
你大額資本支出 到時候有沒有可能像牙膏Fab切不掉
你純當豬屎屋 有沒有可能被代工/出租算力卡脖子
韭菜腦還在吹,難怪整天被土共割韭菜
連館長都說這東西超牛還有人在崩潰
這你放在財務模型參數隨便改一下權重隨你怎麼掰的
https://i.imgur.com/34pi50G.jpeg 要看deepseek員

工這一句話到底是承認有偷用 還是只是嘲諷?
如果真是5萬台h100那就不是論文裡宣稱的那個成本了
牛逼
Capex 多少?
AK的結論是並非不需要這麼大量的GPU,但要確保資源
不浪費,在資料給演算法上還有很大進步空間
中黑跟中吹果然是同文同種
這篇中肯 老鐵還是有料的
還有人在跳針中國有多少GPU喔?
唯一可知是川普要不要繼續禁吧
依黑悟空的經驗大概要再吹一個月
大家再忍忍
珀瑙蟾蜍還是去大煉肛吧☺
TSMC:你終究還是需要很多的高階晶片。 一直沒機會
撿便宜的,星期一晚上不是應該要all in 了。
但事實上硬體不段進步 AI天花板就能繼續拉高 不會因
憎恨中共 理解中共 成為綠共☺
為你用1/10的算力就能達到的事 就不需要更好的硬體
我會這麼解讀 1/20等於可以19/20拿去做其他模型訓練
搞不好 有其他更成功模型 沒被揭露 細思極恐
中國做AI根本不缺錢和能源
能源他們自己就多少水壩和核能電廠了
啊鏟子就會少買了啊
不會少買 比方說本來天花板才100,但因為新的演算法
天花板可以到1000。
一直都是硬體在限制軟體的極限
不會少買 是買的時間拉長 gating在公司人腦
他不用急著編預算找錢採購搶卡 可以攤到好幾年買
啊做鏟子的財報看下去還不是少買
只要一扯到鄰國,總是要批一下才有錢賺阿
股版真的很多發文智障化
党:臺灣價值不夠,都是中吹
Andrej是誰,有我大民進黨厲害嗎
重點除了他們用GPU有多少之外,還有他們說謊這件事
啊,誠信很重要
在那邊罵的中吹昨天有沒有繼續放空nvidia ,沒有的
話都是在嘴而已
我前天120接了 謝謝
對帳單呢
貼給你的話你會跳樓嗎
還有我在ptt以外看的平台 一堆人接117-120的 沒這
麼難吧 這邊的人腦袋太神奇了
好啊 我馬上從窗戶跳下去 你貼啊
好
先跟你說我住一樓
快貼吧
說有買附對帳單不是剛好
那算了
我沒好處不貼的 你可以看我以前的文我也貼過
這樣wtf5566要怎麼回應
笑死 不敢貼了
希望你笑到死喔 冤魂別來找我
我用pttweb沒有看到你有1/27之後的以前的文
吃年糕、年菜小心點 別笑太大力
就只有這一篇 你是貼在哪?
抱歉我懶得花時間跟你講話了 你要跳海或是從高樓跳
下去 再通知我 不過算了 你應該先笑死了
中吹水準就這樣而已
好啦 唬爛了一早上 快滾吧
趕快去做空nvidia all in華為 加油
你也沒單啊 要求別人做事啊
你哪位
中吹真的廢
我有單不想給你看而已 因為不太想被別人免費指使
你先匯款到我帳戶我在考慮
笑死 我又沒說我買 說自己買了附單子不是基本嗎
好了啦 股神
有基本嗎? 那你去找別人吧 別找我 你問問版主這裡
是不是基本
整天討論他國事務,實際點,想想台灣除了台積能吹,
剩下什麼?別整天靠酸中國掩蓋啊
我收虛擬幣喔 現在詐騙太多
你先匯款我就貼單喔
這裡的版規有寫 自己有買就要貼單是基本嗎? 你找
給我看
帳號先公布出來啊 要人匯款這也是基本
這版就是一堆賠錢韭菜啊昨天跌一堆賠錢狗出來吠
帳號先公布出來啊 要人匯款這也是基本
快點 公布帳號
我應該會站內信給你
長一張嘴
你有要匯款再跟我要喔 沒有就算了
好啊 站內信來啦 我幫你公布
沒有要匯款就算了啦
窮鬼
又算了 話都你講的 最後都算了 笑死
哈哈
窮鬼沒錢 沒有要匯款就滾了
不敢給帳號就不要嗆啊
不敢給帳號就不要嗆啊
笑死我
去死一死剛好
笑翻 嗆要匯款不敢給帳號 惱羞成怒是怎樣
怎麼那麼逗趣
支那粉蛆才爽一天 又開始自卑了 說好的重擊美股? XD
大過年罵人去死是什麼情況呀……
那麼想進桶喔?
過年第一天就要上股版吵架阿不然幹嘛?
你沒有要匯款只想公布我帳號吧
還有說自己有買就要貼單的「基本」是在哪看的 我沒
看過類似的版規
為什麼我要透漏自己的個資給你啊
你先給我身分證好了 我就給你帳號 避免被曝光
想要身分證+帳號 拍照 謝謝喔
股版智障化
我就是有單 才敢跟你要這些 黑衣黑衣
明明前幾天一堆人撿117-120 為什麼在中吹眼裡不可
思議 還要貼單不然就是唬爛啊
中吹是都活在什麼世界啊 只有當韭菜的份嗎
某人講到腦羞嗆人去死 也太沒水準,網路互嘴,嘴到
這地步真的好弱
這麼玻璃心其實可以上來網路嘴,回同溫層取暖就好,
留點口德吧
不用上網路嘴,說錯
麵線愛好者的意識型態覺得笑死
笑死 都有人縮了還要上這台車哦
為什麼要跟蟲子吵架?
逢中必反義和團
欸 可是他不是幫DS背書欸... 他只是說GPU的租賃費用
和DS團隊宣稱的訓練費用對得上而已,你貼這篇是要打
臉什麼?
怎麼有人過年崩潰成這樣,真的會笑死XDDDD
可以給開源training的連結嗎,他GitHub上只放訓練好
的模型和inference的程式
可憐啊又再蝦吹
huggingface有人在復現訓練了 不急
建議別亂在股房版嗆人窮鬼 誰比較窮很難說喔
早上吵的好像就不是訓練成本了吧?是在吵其他資本
支出?
但某個巨頭更早開源被全部人無視,他的模型剛出就
能放在便宜的機器上跑,網上也一堆教學,結果網上
的態度好像ds是第一個做這種創舉的
之前板上就有討論啦,meta 開源就是要讓模型變不值
錢,所有人都能進來玩、等於openai gg
中國id 十秒後抵達現場
caltech 十幾年前做AI的被智障噴 自以為自己厲害的
智障
好了啦 中吹
中又贏
爆
1. DeepSeek創辦人梁文鋒,少年股神變AI大神 2. 紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦 3. DeepSeek 宣稱,訓練成本僅 557.6 萬美元,幾乎是其他科技巨頭大型語言模型的十 分之一成本,這個費用也差不多是一位 AI 主管的年薪而已。 綜合以上媒體報導與揭露來看,DeepSeek是什麼狀況,不就很清楚了嗎?13
看了DS的討論,我反而覺得有些商機 1.DS訓練成本是低,只有557萬美金,但訓練要快兩個月。如果稍微多花一點錢,租高階GPU來跑,那是不是可以接受?反正增加兩三倍成本也不貴。 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好,搶市場也很重要。 3.這557萬美金是訓練成本,真要運作不可能只會這樣,那會崩潰。尤其使用者暴增的時候。所以市場普及硬體需求不會上升嗎?那是不是硬體相關股票反而可以增持? 4.會不會出租GPU也變很大的商機?所以可以買相關持股,或是自己買來租?18
Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。7
階G : 2.這樣有多了一個議題,究竟是高階需求會下降,還是低階?畢竟並不全然是省錢就好 , : 3.這557萬美金是訓練成本,真要運作不可能只會這樣,那會崩潰。尤其使用者暴增的 時?
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。44
Re: [新聞] OpenAI執行長:DeepSeek令人驚豔 但關鍵就是算力才是絕對 (新聞用運算這詞可能不太好懂) 吃瓜可以看下面翻譯 無窮算力->無窮智能 這就是OpenAI和Andrej Karpathy, Jim Fan甚至認為11
Re: [新聞] 馬斯克入主後大規模裁員 遭裁員工對藉此篇文章請教一下 tesla前AI大神Andrej Karpathy,今年離開了特斯拉,個人覺得相當可惜,畢竟除了自動 駕駛,機器人optimus 的AI應該都有很大的發揮空間,他的離開對特斯拉應該是一種損失. (對特斯拉未來發展&股價都是偏負面) 目前這位大神Andrej Karpathy有可能加入哪一家科技巨頭企業嗎? or 回學校教書?9
[問卦] 中國deepseek是不是大贏chatgpt?最近有中國AI公司宣稱,用550萬美元成本 訓練大模型語言,效能贏很多美國大廠 台灣有沒辦法達到? 中國人的智慧是不是比美國人還厲害啊?8
[問卦] 脆:deepseek證明台灣不需要核電脆上面說 Deepseek證明訓練AI不需要多高級的GPU也不需要大量GPU 可見發展AI不需要更多電力 世界各企業用幻方的模型訓練AI後 不再需要更多電力6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AIX
Re: [討論] 台派財經網美:Deepseek不可能那麼省錢這幾天R1版橫空出世之前,網上本來就告訴你了。在拜登禁令之前 幻方量化就已經囤了大量GPU。 庫存和投入研發的數量是兩回事 研發成本和復現成本也是兩回事啊 開發和維護windows,幾百億美元成本,但是妳買一張WINDOWS光盤成本幾毛。售價幾百而已