Re: [問卦] 有鄉民看過deepseek強在哪了嗎?
※ 引述《iPadProPlus (哀配之神)》之銘言:
: 安安 欸 幹
: 一直說中國deepseek AI很會算,可以節省98%設備支出
: 不就是代表他的運算邏輯可以比起ChatGPT 還要更精煉?
: 所以到底運算邏輯上差在哪?
: 有鄉民看了嗎?
: 有八卦嗎?
不是有paper和一堆yt在講了
簡單說原本scaling law是單一model 成本是近似指數或n^2誇張上升
所以AI能力要變強 原本是要暴脹式的砸錢
deepseek open的paper說明了 用成千上百個小model集合推論 所以不用被大n懲罰
然後AI原本需要大量人工標註資料 現在R1做到不用預先標註資料了
類似以前alphago master要吃人類千年棋譜 到alphago zero不用棋譜自己來
所以省去大量成本
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.98.6 (臺灣)
※ PTT 網址
推
那老黃不就哭哭了QQ
推
被降維打擊了
→
天才大腦也沒大你多少就強很多
→
可見不是腦容量的問題
→
不然天才大腦都會比籃球還大QQ
→
堆算力就能提高智商本身就反邏輯
→
scaling law問chatgpt, claude, deepseek
→
回答都不一樣耶。deepseek問三次回答都不同
推
不錯的分析
20
首Po安安 欸 幹 一直說中國deepseek AI很會算,可以節省98%設備支出 不就是代表他的運算邏輯可以比起ChatGPT 還要更精煉? 所以到底運算邏輯上差在哪? 有鄉民看了嗎?1
即便是這樣算力的需求還是向上吧 原本需要計算100次的東西新的模型只需要算1次 但人類肯定能找出100甚至10000倍的計算需求啊 就像當年電腦從1khz 到現在 5ghz且多核心以上 整天喊效能過剩,4
在領英上看到 講解的還行 看得懂就看吧 看不懂就算了 正文: 首先,文章贡献主要来自系统(Training Infra),而非模型本身。模型本身依然基于传统的Transformer: 1)他们世界首创在大规模LLM训练中系统性部署fp8(8位浮点)量化技术,这大大降低训练对显卡内存的需求,也加快了训练过程; 2)为了正确使用fp8的矩阵乘法,他们优化并改进了CUDA Kernal的调用方式,甚至给NVDA提出了诸多Tensor Core方面的设计建议
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:57
[情報] Perplexity CEO:實驗性整合DeepSeek R1模標題: Perplexity CEO:實驗性整合DeepSeek R1模型 來源: Perplexity CEO Aravind Srinivas 網址:6
Re: [閒聊] 只剩AI創作的世界就 : 只會是在現有的基礎下做排列組合而已 : 想像一下假如AI出現在浮世繪流行的年代好了 : 如果AI取代了人類畫家,請問AI有可能畫出現在流行的大眼奶大的可愛畫風嗎? : 我想是不會,大家最終就只能拿著浮世繪尻尻吧3
[問卦] AI可否能自己從頭發展醫學診斷看到一篇AI醫學相關的文章 今周刊 「120元基本心電圖,就可抓出未來1~3年死亡機率!」 長庚、榮總到台大都擁抱AI 不 只急診救命 更能找出心臟危機3
Re: [閒聊] 圍棋高手柯潔大談AI繪畫話說現在的AlphaGo Zero可能就突破AI需要灌數據的想法 AlphaGo Zero就只給他規則 讓他自己摸索 結果比學習人類棋譜的AlphaGO Zero還強 AI:人類....實在太多餘了 --3
Re: [新聞] DeepSeek R1來了,追平o1!它現在不這篇有幫大家看過paper了 基本上就是在chain of thought inference 推理的時候 reinforcement跟supervised比例的嘗試 數理問題RL比重高點1
Re: [閒聊] 鋼彈科技樹是否怪怪的為何要人開?: : 看看相對於鋼彈世界落後這麼多的現代都已經有AI這種東西了 : 那在比現代先進這麼多的鋼彈世界 : 為什麼鋼彈還需要駕駛員呢 : 使用AI的鋼彈完全擺脫G力的束縛- 據新聞傳說,DeepSeek用較少且的片數就訓練出性價比第一的Model。 不用花大錢買成堆的尖端晶片,就可以得到這樣的一個結果。 當然各系統比拼還是會持續,直到殺到各資本方成本耗盡、或者有望塵莫及的領先者為止 。 請問DeepSeek這樣子的一個低成本高效能訓練model而言,後續會間接對房市會產生什麼
爆
[爆卦] 台灣少子化蟬聯世界第一!全球冠軍!爆
[問卦] 有遇過什麼少見的姓氏嗎?77
[問卦] DeepSeek怎麼一天就走下神壇?76
[問卦] 要怎麼重抽國運籤?爆
[問卦] 鹿港這樣要700?爆
[問卦] 美國黑人女超胖 反而提告Lyft45
[問卦] 東京超多印度店員?!67
[問卦] 八卦什麼時候變紅了36
[問卦] deepseek 到底是不是抄的 風向好亂35
[問卦] 同輩親戚都是醫師台積電聯發科怎麼辦?39
[問卦] 英文很爛 進的了外商嗎30
[問卦] 烏魚子是不是被炒作的東西?34
[爆卦] 新研究:量子漲落可以解開祖父悖論30
[問卦] 墾丁大街的人行道真的設計這樣?38
[問卦] 中國強的話怎人均那麼低24
[問卦] OpenAI為什麼會輸不起?28
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據29
[爆卦] 領數十億 出賽數7場 內馬爾離開沙超回巴西27
[問卦] 屏東買房!21
[問卦] 如果擁槍合法,8+9還敢半夜吵鬧嗎?27
[問卦] 台灣哪間傳產公司成國際大廠出人頭地的?61
Re: [問卦] 杜奕瑾不忍了!三大創舉奠基Ai基礎爆
[問卦] 再給數位部200億能做出DeepSeek嗎80
[問卦] 全聯福袋滯消中爆
[問卦] 橘貓要叫什麼名字22
[問卦] 周芷若是好人還是壞人?19
[問卦] 有沒有揭露486 deepfake被茶水表的卦19
[問卦] 別雞同鴨講說抄襲 先搞懂什麼是蒸餾16
[問卦] 中國人形機器人上春晚跳舞20
[問卦] 川普下令遣返親哈瑪斯、反猶學生