Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
※ 引述《derekhsu (浪人47之華麗的天下無雙)》之銘言:
: 這段一定很多人沒看懂。
: 正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好,: 近似於大模型(教師)的結果。
: 近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做: 黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾: 到1K大小好不好?
這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的.
https://reurl.cc/26eaDv
Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese
Startup
這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.
( https://reurl.cc/oV6veM )
但是他卻寫出:
Scale AI 最近還與人工智慧安全中心合作發布了“人類的最後考試”,他們將其描述為
人工智慧系統迄今為止最嚴格的基準測試。 Wang 表示,雖然迄今為止還沒有模型能夠在測試中達到 10% 以上的成績,但 DeepSeek 的新推理模型 DeepSeek-R1 已經位居排行榜首位。 「他們的模型實際上是表現最好的,或者與美國最好的模型大致相當,」他告訴CNBC。
也就是說DeepSeek-R1能力根本不輸GPT-4o,
那DeepSeek怎麼可能是靠蒸餾OpenAI來達成這樣的結果呢?
: 還有,他有提到「特定領域」,也就是說是只是一個限定的範圍,而不像是OpenAI或是: DeepSeek要作的是通用的LLM。
: 你不可能靠蒸餾的方式把模型變小還能在通用領域達到跟教師模型不相上下的水準,這: 是違反自然法則的。
--
機械有母性原則 軟體就不曉得了
沒有說只用 可能只是其中一部分
剽竊還有分剽一部份?果然是支那腦的思
維邏輯
剽竊個大綠腦啦,就算是蒸餾也不是剽竊. 因為LLM本來就是得從大量文字中"蒸餾"出來, 你GPT-4o可以在網路上蒸餾不是剽竊, 其他人就是剽竊? 只要DS-R1不是專門從GPT-4o上蒸餾, 那你在哪邊綠腦雙重標準的啥麼德性? 所以你根本看不懂人家說的, 在基準測試中DS-R1能力絕對不輸GPT-4o(甚至超越), 這個代表的意義是啥麼?
※ 編輯: hancel (73.223.112.52 美國), 01/30/2025 10:03:26所以開源也沒法得到結論嗎?

你貼這個幹嘛? OpenAI提出抄襲證據了? 一個閉源的說開源的抄襲, 然後不提出證據這很台灣司法啊.
※ 編輯: hancel (73.223.112.52 美國), 01/30/2025 10:11:51程式碼開源的話,很容易測啦,但抓數據、分
析需要時間,這一定抓的到,因為DS不是全新
架構,非商業授權部分穩死。
開源並不是免罰的藉口
只要OpenAI不提出證據, 你這裡講的通通是廢話.
※ 編輯: hancel (73.223.112.52 美國), 01/30/2025 10:17:26很簡單啦,非自創架構鐵定出事,讓子彈飛一
下
證據滿手也要估計一下商業損害的量,好做控
告啊
閉源是否就無法逆向工程? 你是不懂電腦嗎?
哇有人可以逆向工程LLM訓練集跟參數
諾貝爾獎都不夠你得
宇宙的熱力學定理都被你繞過去
照這邏輯,中國一堆人在拿諾貝爾獎、繞宇宙
熱力學定理,笑死
能不能先去查資料再來秀下限啊
31
只有我看不是很懂嗎? 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI 競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何14
我比較好奇closeai怎麼證明對方有抄? 現在llm訓練出來的model都是黑盒子,沒人看的懂裡面結構 deepseek給closeai能拿來指控的只有他公開的原始碼和論文 這二個說是抄,那第一天就被抓出來了,還需要closeai出來吵? 至於有人說這個是證據的3
我用簡單說法看你有沒有辦法理解 首先中國很多ai研究都跳出來講了 這件事大有問題 沒錯,很多業者都用蒸餾法 但DS的原始模型感覺是拿gpt結果拿去背答案的12
一句話,對岸軟工不是抄就是疊,這次的DS沒意外就是LLM界的鴻蒙,我就問對岸到現在 有產出什麼作業系統 可以比肩 Unix/Linux 或Win的,基礎不行,疊床架屋倒是一流,過 年要大內宣,自己吹就好啦 ※ 引述《wenchinhsieh (windman)》之銘言: : OpenAI:已掌握DeepSeek盜用模型證據8
openai會崩潰完全不意外 會員想使用chatgpt最新版本每個月要花200美金 結果deepseek最新版本r1直接免費讓大家用 導致一大堆輕度使用者退訂chatgpt 以後gpt再放出任何更新更屌的新版本也沒用了8
DeepSeek為什麼要自爆? 抄襲就躲起來偷偷抄就好了,在被美國抓到之前,光靠抄襲就可以進步神速了 不要強調經費少、晶片少也就算了,居然還大加宣揚 那大家就會針對犯罪項目專項驗證 其他人講還有人不信,但是連馬斯克都出來講話了6
這段一定很多人沒看懂。 正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好, 近似於大模型(教師)的結果。 近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做 黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾X
不要老是看藍綠白腦的台灣人怎麼說 我們來聽聽看對岸的同胞怎麼說 昨天就講過 蒸餾技術是甚麼 不懂的看完影片你就懂了9
在DeepSeek震撼全球跟美國AI股價時,霸氣嗆聲已掌握DeepSeek盜用openai 資料模型的o penai 公司,表示不會對其提告,會繼續專心做好自己的工作。 OpenAI真是佛心又大氣的公司! --5
好笑的是 前幾天推特陸續有人分享 用OPenAI新的o3-mini-high 中間推演過程會開始跑出中文 然後問它是不是有用什麼中國的AI模型
爆
Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預teamblind 匿名的可能有人不信 與其聽匿名、鄉民互吹/貶 不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法 2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪 截至今日有 840 萬人看過這個影片57
[情報] Perplexity CEO:實驗性整合DeepSeek R1模標題: Perplexity CEO:實驗性整合DeepSeek R1模型 來源: Perplexity CEO Aravind Srinivas 網址:57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。17
Re: [新聞] DeepSeek爆紅 藍委放話「台灣等著被智看這篇文章 -its-model-to-train-competitor/ai/amp/ 如果所言不假 那其實就是deepseek 拿人家的大模型訓練自己的小模型8
[問卦] 如何利用deepseek開源模型 建構台灣AI聽說 deepseek-R1 是目前開源AI模型第一名 我有一個大膽的想法 既然這個模型是開源的 我們可以使用這個模型來建構台灣的 openAI 擺脫對美國AI大廠的依賴 是不是很聰明啊?8
Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對openai只有開源好幾年前的模型 現在meta google m$ 的開源模型都屌打好幾條街了 用過deepseek的人都知道,deepseek是蒸餾上面那幾個開源模型 況且deepseek也有把自己的模型和程式碼都公布出來 開源的精神不就是這樣嗎?1
[問卦] DeepSeek 就只是仿造ChatGPT 還吹成這樣剛看了DeepSeek R1原始文件 Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. arXiv preprint arXiv:2501.12948. 看完結論就是
爆
[問卦] 國旅真的爛到一個極致爆
Re: [問卦] 台灣為啥一堆底層整天說自己開戰要投降?爆
[爆卦] 韓國執政黨議員的兒子涉毒被調查86
[爆卦] Skype將於五月永久終止服務49
Re: [新聞] 林宅血案45年未破 賴總統首度道歉:政府34
[問卦] 川普與澤倫斯基在白宮見面34
[問卦] 日劇標配是跑步 台劇標配是?18
Re: [問卦] 美國又對中國額外加 10% 關稅?26
[問卦] 笑死莫那魯道也可以當偉人爆
[問卦] 賴這麼爛為什麼還那麼多人支持?26
[問卦] 王品肉慾節~穿黑絲襪進店烤肉享一折24
[問卦] 怎麼簽個約吵成這樣?25
[問卦] 真的有人會把朋友從階梯上推下去嗎?17
[問卦] 都78年了 要還多久?15
[問卦] 拍過周董mv的女生 誰最漂亮?17
Re: [問卦] 台灣為啥一堆底層整天說自己開戰要投降?19
[問卦] 這張圖有人有辦法看全部的黑點嗎?18
[問卦] 元始天尊和如來佛祖 誰更厲害 ?87
Re: [新聞] 二二八事件78周年 賴總統:獨裁者蔣介石14
[問卦] 靈異教師神眉裡面最喜歡誰15
[問卦] 為什麼不挖韓國女團過來?只挖啦啦隊?49
[問卦] 228跟3+11哪個導致比較多人死亡?26
[問卦] 姓「幹」要取啥才會好聽又霸氣?15
[問卦] msn messenger 是怎麼沒落的15
[問卦] 台海戰爭爆發 該聽政府的話?還北京的?13
[問卦] DJI的圖傳是不是黑科技?12
[問卦] teams多難用?14
Re: [新聞] 《我獨自升級》開拍!車銀優確定主演成振13
[問卦] 勁辣雞腿堡是不是最強的瀉藥神器?12
[問卦] 認真問,全家3000元禮券可以買什麼?