Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
這篇文章的核心意思就是
我們掌握著一些竅門,可以提升回答質素的那些,我們早就實踐,而且怕被快速追上,所以把他們閉源了
但是這些訣竅被中國人自己研究出來了
還有一些技巧,早就可打破一味堆算力的瘋狂勢頭,但是為了保護美國七巨頭現在
極好的股票上升勢頭。我們把它們擱置了,ds一出,我們不得不把低成本部署的算法都拿出來準備實施了
現在的問題就是,一直靠堆算力堆數據堆電力就能到達AGI的幻境破滅了
投資人的狂熱消散了。起碼第一波狂熱終於被點破了
※ 引述《Lushen (pttlushen)》之銘言:
: OpenAPI 的 Chief Research Officer (首席研究員)
: Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文
: https://i.imgur.com/A73X07x.png
![圖 OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/A73X07x.png?e=1738476102&s=IHvDbVIs79v6t5gOycMFXA)
![圖 OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/rjDczVH.png?e=1738488567&s=LKTqsRAMdvyjVsigoz5BQg)
: 不過,我認為外界的反應有些過度,特別是在成本相關的敘事上。擁有兩種範式(預訓練: 和推理)的一個重要影響是,我們可以在兩個軸向上最佳化能力,而不是只有一個,這將: 帶來更低的成本。
: 但這也意味著我們有兩個可以擴展的軸向,而我們計劃在這兩個方向上都積極投入算力!: 隨著蒸餾(distillation)技術的成熟,我們也看到降低成本和提升能力這兩者之間的關: 係越來越解耦。能夠以更低的成本提供服務(尤其是在較高延遲的情況下),並不代表能: 夠產生更強的能力。
: 我們將持續改進模型的低成本部署能力,但我們仍對研究路線保持樂觀,並將專注於執行: 計劃。我們很興奮能在本季度及今年內推出更優秀的模型!
: Congrats to DeepSeek on producing an o1-level reasoning model! Their research: paper demonstrates that they’ve independently found some of the core ideas
: that we did on our way to o1.
: However, I think the external response has been somewhat overblown,
: especially in narratives around cost. One implication of having two paradigms: (pre-training and reasoning) is that we can optimize for a capability over
: two axes instead of one, which leads to lower costs.
: But it also means we have two axes along which we can scale, and we intend to: push compute aggressively into both!
: As research in distillation matures, we're also seeing that pushing on cost: and pushing on capabilities are increasingly decoupled. The ability to serve: at lower cost (especially at higher latency) doesn't imply the ability to
: produce better capabilities.
: We will continue to improve our ability to serve models at lower cost, but we: remain optimistic in our research roadmap, and will remain focused in
: executing on it. We're excited to ship better models to you this quarter and: over the year!
: : 喊得很大聲,做出來的不過就那樣
--
當心,被擊沉的推文跟班有:
LiXX FaXX LuckXX DrGXX shiriXX downtoearXX stanthemXX liweitseXX
--
所以人家的「蒸餾」說 不敢正面回應?(如算式等)
美國狗輸不起了
美國例外論信仰崩塌
推一味,願意好好選字的人越來越少
自己腦補就不用硬扯啥人家的意思了
要一直保持第一 很累
沒吧 應該是更有效率的演算法加上更多的硬體 可以
更快達到AGI的目標
cudnn效率不是最佳
有點像仿製藥的歷史,軟體應該更難封鎖技術複製
單純腦補 笑死
OpenAI不可能開源的,有pretrain data在手,沒必要
開源
在這裏幫DS洗地到底有什麼好處? 看不太懂網路與論
這波操作
仿製藥的問題,1.合成2.要有受試者驗證
軟體的話,小魯就不確定會卡在哪邊y
中吹就搞笑啊,不過拿錢辦事可以理解。
會洗地嗎,不就一堆在嘲諷不能查64,造假,抄襲,
討論的重點一直都在於更低的成本達到相同效能,這
洗什麼地
好處就是降價97%
![圖 OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/cUq8tHw.jpeg?e=1738478435&s=cTAHOyIX03avUz5AdUNPYA)
LLM是到不了AGI的 信徒早點洗洗睡
訂閱要花兩百美元現在有低價版,低價版卻變成靶子X
D
有錢拿吧,上面Lushen都已經開示了,也洗好幾天了
好處就是一般需求的人用DS就可以了
目前的經濟環境 各國經濟自主 美國想用AGI征服世界
也不容易 大概需要一次大蕭條的經濟重置
華碩 宏碁 都可以自建AI雲了 打破壟斷
AI護城河還沒套利變現,就被DS挖了祖墳,看你氣不氣
至於版上多蛙 在喊多 都沒意義 要知道民主共和黨
後面站的都是猶太人 只是這次換選共和黨而已
你們在這裡喊多 但是操盤的猶太人要收回資金了
你們會贏嗎 呵呵
好啦不然你推說要買啥啊
中國花錢買網軍的實力真的跟DS一樣稱霸世界
什麼叫一般需求夠用?現在AI已經夠了?
好啦,意見不同先抹黑最實在
腦補太多了吧
後半段全部都是你自己在想
電力股已經開始反彈
採訪說要用法律保持科技領先..怪怪
AI不只本夢比,還遇到追兵
ai還能幹嘛,說來聽聽
別造謠 門外漢就別亂評論
AI應用應該還有很多領域還沒完善,還是有砸錢搞算力
的需求吧,不過可能語言這部分會降低需求
而且應用落實後,研發可能需求降低,但應用方面需求
也可能會更多
妳的結論就是硬ㄠ
57
DeepSeek這玩意不管是真是假,但的確撼動到US金融市場 所以過去24小時的劇情是這樣發展的 1.正在為聯邦預算頭痛的DOGE馬,開了第一槍,畢竟社保基金還一籮筐在 股市,這錢無論如何是不能賠的,NVDA不小心搞崩,會帶垮七仙女的 先不管有沒有驗證,既然屁股在那裡,先喊詐騙再說44
比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…23
各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強16
現在全網路上的開源數據資料是屬於pre-training端 大多都是野生數據 無標籤 那東西只是讓模型去向鸚鵡一樣 去做文字接龍 但第二階段訓練會用到RLHF (Reinforcement Learning from Human Feedback) 就是要人類針對不同數據給意見 這個是要給標籤 所以你才會聽到狗家之前要求全公司員工去給意見讓Gemini前身 Bard 去做人類feedback32
各位是不是忘了 中國人文化 先說ㄛ 我沒深究 但我六年前影像的 我猜原理應該還是差不多 AI 發展幾十年 論文裡從沒看過 模型能只接把算力幹掉90%的 偏偏中國人就可以,雖說中國人也發表過幾篇幾十萬引用的優秀模型 但經典開源模型裡 通常會給出爆
以下部分資訊來自於Reddit anitakirkovska文章的翻譯 LDPC哥哥講到一個重點 Reinforcement Learning =/= Reinforcement Learning from Human Feedback 這也是R1為什麼爆紅的原因1
前文恕刪 : 看到這東西,反正是開源的,程式碼都攤開在那邊給你看 : 應該是要想著怎麼去利用,而不是討論中/美或成最大贏家嗎? : 怎麼搞到變成政治意識形態的爭執了? : 有些推文一直扯到超導體,我就不懂有什麼可比性...50
OpenAPI 的 Chief Research Officer (首席研究員) Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了
67
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也應該不用那麼久 重點是DS是開源的 現在應該有許多數據中心已經開始實驗DS的演算法 我們先假設DS的創新 是往AGI道路上的王道57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。9
[問卦] 要收費的OpenAI是不是完蛋了感覺美國的這些AI公司都講好了 開源的模型不能超越閉源的 很明顯這些開源的大公司有在禮讓 不能把別人的飯碗全部端走 讓OpenAI這個閉源的可以繼續撈7
[問卦] 簡單解釋deepseek到底可怕在哪?目前簡單地了解一下, 好像是幾點: 1.成本省98%? 2.不需要堆算力? 3.不用聯網本地運行?X
Re: [新聞] 谷歌前執行長施密特:AI這場史詩級競賽有些人真的像活在平行世界。很好奇他們平時獲取信息的途徑到底是什麽? 竟然說中國ai不强、沒有原創性、沒有模型之類的……你但凡研究一下全世界任何一個層面 的ai現狀,以便你更好的投資ai產業,你也能發現中國的ai存在感和競爭力是和美國同一層 級並緊緊跟隨的。 并且,如果以中美ai的研究、應用、投資規模爲基準,全世界其他國家從廣度、深度上看,5
[問卦] 七巨頭不能用Deepseek算法發展AGI嗎?既然打不贏就加入他 如果發現高規格的堆算力是多餘的 那就直接引用DeepSeek的算法 這樣器具頭高規格的算例不就可以直接發展AGI了嗎?有什麼好恐慌的? 該恐慌的是目前輝達暫時不會有訂單因為大家發現其實早就買夠了?3
Re: [黑特] 民進黨支持者思想真的很幼稚青鳥跟塔綠班們 都不知道DeepSeek是開源的 所以才有那些奇怪自卑推論 這次中國產生DS 其實對全世界都是一個正面的發展 也就是 花小成本也可以 作出 大成本模型效能的AI語言模型 重點是這個模型的程式碼跟架構 還跟全世界分享 也就是 台灣人照抄 也可以作出自己想要內容的 DeepSeekX
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據一天前,綠共閩南台派 還處於挨打的狀態 猶如黑悟空甫推出的幾天那時的情景 八卦版還可以光明正大的質疑: 為什麼中國不自由卻做得出3A? 外國看起來黑神話也引起轟動!?1
Re: [問卦] 有鄉民看過deepseek強在哪了嗎?即便是這樣算力的需求還是向上吧 原本需要計算100次的東西新的模型只需要算1次 但人類肯定能找出100甚至10000倍的計算需求啊 就像當年電腦從1khz 到現在 5ghz且多核心以上 整天喊效能過剩,
70
[情報] 114年02月19日 三大法人買賣金額統計表98
Re: [請益] 戰爭時的資產安排31
[標的] 3037 欣興AI未來多26
[標的] 00712有點猛29
Re: [新聞] Trump threatens 25% tariffs on fo26
Re: [新聞] 獨/蛋價腰斬飼料又漲蛋農雪上加霜 盼提9
Re: [新聞] 美俄結束停戰會談!川普控「烏克蘭先對俄32
[標的] 1789 神隆(第四次)18
Re: [新聞] 「陶朱隱園」宣布正式開賣 單價估300萬19
[標的] 蛇年中小多9
[情報] 0219 上市投信買賣超排行9
[情報] 是方(6561.TW) Q4 4.097
Re: [請益] 戰爭時的資產安排15
[請益] 國泰複委託交割問題24
Re: [標的] 5474聰泰-黃仁勳兆元宴隱藏嬌點多26
Re: [標的] 3227-原相 股版首發2
Re: [新聞] 全包了!台積電一口氣買下全台最大風場20X
Re: [新聞] 獨/蛋價腰斬飼料又漲蛋農雪上加霜 盼提3
Re: [新聞] 美能源部長:2050淨零排放是邪惡的目