[問卦] DeepSeek成本這麽低的原因是啥?
Deepseek 橫空出世
應該讓大家都嚇了一跳
程式碼是開源的
有高手看的出來訓練成本這麼低的原因是啥嗎?
--
演算法
因為支那賤畜命不值錢,不過別誤會,
這可能反而是國力呢
長期耕耘
搞你心態成本隨便說你也信
養套殺 你看過蝦皮模式就知道了

樓下賣屁股為什麼這麼便宜
演算法,算力不足,算法來補
他數據集從OpenAI蒸餾過來,GPT3.5
的成本裡面有7-9成都是用在數據集建
立,你大概能猜到為什麼他那麼便宜
了
答案準確率很低算ai嗎?
後台躲著習近平
就蒸餾啊,OpenAI都講了
演算法
1偷的東西最便宜
凸( ゚д゚)凸文組很難跟你解釋滾贛
抄
有張貓貓釣魚圖蠻貼切的
演算法優化
遊戲也是 有跑很慢 跟跑很順的
演算法
所以才說叫技術突破
給進去的資料是都處理過的,這方面省很大
因為沒有藍白砍預算
牛逼遙遙領先 祖國已經超越美帝科技封鎖
後續只要有新的應用需要重頭來過deepseek
沒辦法從任何來源得到精緻的資料源時依然
還是要跟人拚硬體資源計算能力
抄襲點麵線軟體
上面已經有人解釋,用蒸餾形容滿貼切的
凸( ゚д゚)凸蔡英文那4年的數位部拿的
n倍錢只能出點麵線平台砍預算客氣了好
嗎
童工啊,強迫勞動
中國基本時薪多少你知道嗎?
不是養套沙?
用蒸餾你參數也要調成總是能抓到 feature
s啊,這是他們高明的地方
吹的
中國人命不值錢
為什麼盜版windows賣這麼便宜?
中國不就最愛換皮嗎
就教授念了很多書 寫出一本教材
然後學生拿教材改了一些 當然很省事
低階人才一堆啊,哪像台灣一流AI人
才都在網上抓網軍,問64.溫馨。
東方神秘魔力
成本很多都是人事成本
就唬爛的啊
直接拿別人訓練好的ai來幫忙訓練 當然便
宜啊

cost down可以一次降這麼多,有點誇張
直接串openai的api
數發部的台灣價值不容你質疑
唐鳳都可以下載來玩 不就是證明
山寨
抄
中國人的尿性怎麼會不知道
抄作業
open ai把資料撈好 ds直接拿來用 成本
當然省
不是用蒸餾形容貼切吧,那就是蒸餾法
啊
就小語言模型
蒸餾
用演算法榨出工作排程,避免有閒置單位
抄他家
有沒有可能成本是假的?人家說什麼就信什麼
蒸餾
低報啊
不過他們的中文比gpt順暢很多,這就很
好用的
人家說什麼就信什麼 美國股市都是天才嗎

幫你18分看完deepseek論文在講甚麼
偷用美國限制的高階晶片當然不能說啊
天才數量的量體不同
因為有200億資金
偷來的東西你說呢
站在巨人的肩膀上
大外宣 他只是說舊版本的成本 但一堆藍
莓把它吹成最新版的成本
東方唯一能与美國霸權抗衡祇有中國
憨直不懂商業刀法撈錢
論文自己看
10
目前的推測應該是跳過了訓練模型的部分 也就是說不是從0開始構築AI模型,而是用成熟的AI模型來訓練,避免掉很多無謂的試錯 或空轉,也就是之前新聞在說的「蒸餾技術」 AI 系統中的 「蒸餾技術」(Knowledge Distillation,知識蒸餾),是一種 模型壓縮 (Model Compression) 方法,主要用來讓較小的模型學習較大模型的知識,同時保持高18
因為DeepSeek本質上是優化,而不是從頭幹一個LLM。 他是拿Meta的開源模型當基底,然後用OpenAI去產訓練資料, 再加上創新的Fine Tuning技巧去進行優化的, 並不是真的用5%的成本跟算力就可以完成OpenAI走過的路徑。 的確DeepSeek(以及近期中國各家公司爭先恐後發表的模型)模型上提出了創新的方法10
分兩個部分來說, ——————————————— 第一個部分是澄清: DeepSeek 是微調別人做的基本模型。 比如臉書 meta 花數千萬美金或上億美金做出模型 llama.4
Hi 可否問一下比較不專業的問題 1. 大致照你這邊提到的部份 那麼Deepseek 主要省訓練成本的部份 主要是跳過SFT(或著也許 還有其它步驟)的這個作法 而不是像一些報導說的 直接"蒸餾"ChatGPT"(直接用ChatGPT的問答訓練一個較小模型)6
沒有錯, 成本除了 “訓練微調出模型”,還有”應用時推論營運成本” 1. 訓練主要跳過 SFT, 2. 推論營運的成本就是雲端假設大家的應用成本,也同時帶動本地假設的可能。 所以我 Mac M2 Max,有 64GB ram,跑 DS 70B 速度還不錯,30B 完全舒服。
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)爆
[問卦] 台灣人為啥一堆在崩潰DeepSeekDeep Seek本身就是開源的 又告訴大家還能低硬體成本 對AI發展根本是好事情 開源會促成共享跟加速技術發展 而且無國界47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。9
[請益] DeepSeek破壞市場行情不用被懲罰嗎?DeepSeek目前將成本壓到這麼低 不論是ChatGPT還是metaAI成本都不可能這麼低 但DeepSeek卻破壞市場行情讓股價失衡 這麼做不用被懲罰嗎? -----9
Re: [請益] Deepseek v3 對台積電有影響嗎沒想到吹沒多久 當問DeepSeek-V3:"你是什麼模型" DeepSeek-V3竟然回答:"我是chatgpt"6
[爆卦] 尷尬 支那大模型Deepseek v3自稱chatgpt支那AI公司DeepSeek三天前推出DeepSeek-V3 該公司公布的性能可匹敵GPT-4o以及Claude-3.5-Sonnet DeepSeek-V3用2個月訓練2048個GPU只花588萬美元 遠低於GPT-4o約1億美元 粉紅五毛藉此嘲諷美帝封鎖高階晶片也無法阻止支那AI7
[問卦] deepseek公布成本開源?大家一起撈不好嗎?如題 deepseek基本上是用上兩代的老黃晶片下去跑 成效逼近openai最新模型不說 成本可能不到人家2% 才是這次ai相關股慘跌的原因6
Re: [問卦] Deepseek到底好不好用?財經知識美少女Emmy在她的粉專說 deepseek一定是造假 中國人喜歡說謊 不可能用這麼低的成本跟算力來訓練模型 真是天資聰穎又美麗的知識少女3
Re: [黑特] 民進黨支持者思想真的很幼稚青鳥跟塔綠班們 都不知道DeepSeek是開源的 所以才有那些奇怪自卑推論 這次中國產生DS 其實對全世界都是一個正面的發展 也就是 花小成本也可以 作出 大成本模型效能的AI語言模型 重點是這個模型的程式碼跟架構 還跟全世界分享 也就是 台灣人照抄 也可以作出自己想要內容的 DeepSeek- 聽說deepseek v3這東西比別人開發的成本低很多 1.2000 顯示卡訓練 2.成本比他牌低數百倍 完全開源 但我不太明白於是想找看看相關影片說說
爆
Re: [問卦] 你中頭獎願意公開領獎嗎???爆
[問卦] 女兒被性侵 爸爸私刑殺人 你真的OK?爆
[問卦] 陳凝觀:金馬這麼親中 被中國拿去我可以爆
[問卦] 澤倫斯基怎麼從民族英雄變成騙錢的獨裁者爆
[問卦] 脆:美軍幫就贏了 不幫就等輸 幹麼當兵爆
[問卦] 無人機也太可怕了吧98
[問卦] 青鳥跟黑熊學院突然不舔曹董了?99
Re: [新聞] 影/涉詐助理費...林岱樺遭搜索大喊:政91
[問卦] 曹興誠任文化總會,是宣揚什文化?66
[問卦] 台灣為什麼不搞核武67
[問卦] 陳妍希也算是正妹嗎?56
[問卦] 這麼多權貴閃兵,怎麼就王大陸被抓阿?爆
[問卦] 烏俄戰爭變這樣 你們都不擔心?52
[問卦] 直接宣布一開戰就炸爛台積電是否是唯一解49
[問卦] 歐洲明明比俄國強,怎麼淪落至此?43
[問卦] threads熱議:禁止說聖母病37
[問卦] iPhone 16e 報價出來了 有誰會買嗎?97
[問卦] 台灣的澤倫斯基是誰?35
[問卦] 未來課本澤倫斯基是民主鬥士還是獨裁者35
Re: [新聞] 影/涉詐助理費...林岱樺遭搜索大喊:政34
[問卦] 華人貶低教育+低成就 沒自信有解嗎?18
Re: [新聞] 愛女疑遭下藥性侵輕生亡 父私刑釀1死1重傷27
[問卦] 垃圾自稱台派連捐血都要嘴??23
[問卦] 單眼相機是怎麼沒落的?26
[問卦] 北韓是烏俄戰爭最大輸家?27
Re: [新聞] 曹興誠突認「私人照片」外流 謝寒冰追22
Re: [新聞] 疑涉詐助理費!林岱樺發聲明:8任立委任54
[問卦] 台積電是曹興誠帶,現在會如何?23
[問卦] 拜登死去哪了?當初慫恿烏克蘭加入北約22
Re: [新聞] 林岱樺遭搜索 家底厚不缺錢...地方震