Re: [問卦] 有鄉民看過deepseek強在哪了嗎?
※ 引述《iPadProPlus (哀配之神)》之銘言:
: 安安 欸 幹
: 一直說中國deepseek AI很會算,可以節省98%設備支出
: 不就是代表他的運算邏輯可以比起ChatGPT 還要更精煉?
: 所以到底運算邏輯上差在哪?
: 有鄉民看了嗎?
: 有八卦嗎?
https://youtu.be/l8NKedgzDtE?si=I7S6mpEzsw7OrluD
這新聞訪談Perplexity AI 的CEO Aravind Srinivas 的採訪。
照新聞描寫Perplexity AI是什麼 我是沒聽過
華爾街日報 針對5款聊天機器人進行測試,並為各種使用場景的回覆品質排名。
爆冷奪第一
先從結果說起,奪得整體評分第一的並非ChatGPT,
而是由新創公司Perplexity所推出的
同名聊天機器人 ,拿下這場「聊天機器人奧運」的金牌。
這位ceo 的評價 很有參考性
AI我是不懂 大致原理本質都在處理一堆數學 讓計算各種參數後的結果
更符合正確的答案
deepseek 的優勢 更精準 更少的參數 減少大量計算
讓H800的運算力 可等效20倍數量的H100
評價deepseek的論文 運算訓練模型的方法 is a good idea!(也是AI巨頭擔憂的)
看上面的訪談大概都說得明白了
--
※ PTT留言評論
20
首Po安安 欸 幹 一直說中國deepseek AI很會算,可以節省98%設備支出 不就是代表他的運算邏輯可以比起ChatGPT 還要更精煉? 所以到底運算邏輯上差在哪? 有鄉民看了嗎?3
不是有paper和一堆yt在講了 簡單說原本scaling law是單一model 成本是近似指數或n^2誇張上升 所以AI能力要變強 原本是要暴脹式的砸錢 deepseek open的paper說明了 用成千上百個小model集合推論 所以不用被大n懲罰 然後AI原本需要大量人工標註資料 現在R1做到不用預先標註資料了1
即便是這樣算力的需求還是向上吧 原本需要計算100次的東西新的模型只需要算1次 但人類肯定能找出100甚至10000倍的計算需求啊 就像當年電腦從1khz 到現在 5ghz且多核心以上 整天喊效能過剩,4
在領英上看到 講解的還行 看得懂就看吧 看不懂就算了 正文: 首先,文章贡献主要来自系统(Training Infra),而非模型本身。模型本身依然基于传统的Transformer: 1)他们世界首创在大规模LLM训练中系统性部署fp8(8位浮点)量化技术,这大大降低训练对显卡内存的需求,也加快了训练过程; 2)为了正确使用fp8的矩阵乘法,他们优化并改进了CUDA Kernal的调用方式,甚至给NVDA提出了诸多Tensor Core方面的设计建议
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片爆
[情報] AMD 興奮宣布 Instinct MI300X GPUs 支援 DeepSeek-V3標題: AMD Instinct GPUs Power DeepSeek-V3: Revolutionizing AI Development with SGLang 來源: AMD's X (Twitter) 網址:57
[情報] Perplexity CEO:實驗性整合DeepSeek R1模標題: Perplexity CEO:實驗性整合DeepSeek R1模型 來源: Perplexity CEO Aravind Srinivas 網址:21
Re: [情報] Perplexity CEO:實驗性整合DeepSeek1.所以GPU只應用在像open AI 這裡? 2.所以蜥蜴人公司只是開發像open AI 這種東西? 蜥蜴人ㄧ週前早說發現中國的deepseek 那蜥蜥人知道了這事情, 3.本週5怎麼還增加今年2025金費買GPU?15
Re: [情報] Perplexity CEO:實驗性整合DeepSeek R1模Perplexity CEO Aravind Srinivas 發推特恭喜 Deepseek: Congrats to @deepseek_ai for getting to #1 on the App Store. For a while, it wasn't clear who would beat ChatGPT for the first time. The best we could manage was #8, a year ago. Look forward to using all their models for search, assistant, and agents this year. 恭喜 @deepseek_ai 登上 App Store 第一名!曾經一段時間,我們並不確定誰會是第一個超越 ChatGPT 的。最好的成績是在一年前拿到第八名。期待今年能使用他們的所有模型,包括搜尋、助手和代理服務! -6
Re: [問卦] DeepSeek問世會讓顯卡降價嗎顯卡一定會漲價 目前己經有很多deepseek布署在本機電腦的教學 ollama上也有deepseek R1模型可以下載 deepseek R1模型各參數量對顯卡記憶體需求3
Re: [新聞] 突然爆紅的DeepSeek嚇壞矽谷 美股期指和Ai 搜尋最大的問題就是限制一堆 像Gemini就不能談政治議題 ,我有裝youtube summary with chatgpt插件,Gemini 碰到政 治累全部不做 DEEPSEEK 搜索比PERPLEXITY 好多了 我問 高雄捷運車廂廣播太大聲,他的上一級單位是誰管
爆
[爆卦] 曹興誠第二篇聲明爆
[問卦] 選出一個你這輩子玩過最好玩的單機遊戲40
[問卦] 挖曹興誠隱私等等30億不捐了 你真的OK?43
[問卦] 罵中國卻玩中國女人是啥洨?42
[問卦] 幹中國小三有比較台派的說法嗎?26
[問卦] 零關稅紐西蘭鮮乳來了!為何台灣鮮奶還28
[問卦] 機械鍵盤 線性軸怎麼紅的?35
[問卦] 黑熊學員眾現在在想什麼23
[問卦] 蔡康永有什麼代表作爆
[爆卦] 曹董小三公司助力中國夢 中共黨媒認證21
[問卦] 急!新北租房這個價格如何?16
[問卦] 獨角獸那麼叫:紐乳來了,為何台乳仍天價?爆
[爆卦] 曹董進來,我幫你解套。56
Re: [新聞] 快訊/竹聯幫主治喪委員75人名單曝光!18
[問卦] 漢寶泡麵能撐多久17
[問卦] 便宜的紐西蘭鮮乳去哪買17
[問卦] 職場上真的會有功高震主的事情嗎?12
[問卦] polo衫要怎麼穿的帥?28
[問卦] 鄧肯是歷史最強大前鋒嗎?16
[問卦] 永康街為何很多觀光客??16
[問卦] 明朝末年的飢荒到底有多嚴重?15
[問卦] 想要長肌肉 健身是唯一解嗎?2
[問卦] 阿公過世,長孫不回來?13
[問卦] 來一客 鮮蝦口味 為什麼能稱霸市場多年14
[問卦] 有無哪吒1-哪吒之魔童降世 也好看的八卦?12
[問卦] 冷氣團在哪?笑死10
Re: [問卦] 為什麼現在國小老師常叫學生去看 身心科?12
[問卦] 黎明最紅的歌是什麼??12
Re: [新聞] 曹興誠遭爆公開不雅照 林智群:監督老百10
[問卦] 板橋的0號屎徒,找到了嗎?