Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
※ 引述《wenchinhsieh (windman)》之銘言:
: enAI是聊天機器人ChatGPT的開發商。
: 蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並: 讓他們在特定任務上以更低廉的成本得到類似結果。
這段一定很多人沒看懂。
正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好,近似於大模型(教師)的結果。
近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做
黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾
到1K大小好不好?
還有,他有提到「特定領域」,也就是說是只是一個限定的範圍,而不像是OpenAI或是
DeepSeek要作的是通用的LLM。
你不可能靠蒸餾的方式把模型變小還能在通用領域達到跟教師模型不相上下的水準,這
是違反自然法則的。
另外,使用OpenAI來前處理基本上已經是業界不說的常態,Github上甚至有微調方法直
接教你綁訂OpenAI來作蒸餾,只要你不要做出會威脅到OpenAI的東西,他是不會理的,
網路上幾百個開源模型都是這樣作出來的。
如果OpenAI只能找到這個理由去argue,而不是針對他釋出的權重或是演算法進行爭論,只代表這東西是真貨。
最後是有關於證據的問題,現在的問題是,OpenAI根本不能提出證據,因為OpenAI已經
在他們的使用條款說過使用API的條款如下:
"""
根據 OpenAI 的資料使用政策,自 2023 年 3 月 1 日起,除非您明確選擇與 OpenAI 分享您的資料,否則 OpenAI 不會使用透過 API 提交的資料來訓練或改進其模型。然而,為了監控濫用行為,OpenAI 會將透過 API 傳送的資料保留最多 30 天,之後會將其刪除,除非法律另有規定。
"""
也就是說,OpenAI如果拿出使用紀錄,那就表示OpenAI根本沒有遵守使用條款,偷偷紀錄用戶的資料。
那你如果沒有保留用戶的資料,那現在是要用什麼證據來調查?
--

結論:小偷偷東西怪人裝監視器...
這只是民法上證據合法性的問題不影響勝
果然很中國
訴 之後不合法獲取的訴訟是另外之訴
簡言之就是一碼歸一碼
如果openai自打臉等於證明自己才是偷用戶
所以你不用做夢說因為說沒紀錄就告不成
其實連偷都很難定義吧
資料的小偷喔
一樓圖不錯喔

到時用過openai的反而可以告他,我相信很
多人為了敲一筆絕對會這麼做
想問蒸餾多個學生 組專家系統 能贏老師嗎?

給法律完全沒概念的供參
你出現幻覺了嗎?我這篇文章有提到訴訟嗎? 我這邊提到的是他如果遵守使用條款,他就不會有去年秋天的資料,他如果有去年 秋天的資料,他就違反使用條款,就這麼簡單而已
※ 編輯: derekhsu (175.182.32.109 臺灣), 01/30/2025 00:54:54 ※ 編輯: derekhsu (175.182.32.109 臺灣), 01/30/2025 00:56:10別理無知天才!這個開源軟體真的很屌
花不到20億可以打腫所有ai公司老闆
也只能討錢 技術流出是不可逆的 除非
還覺得那些公開技術文件嚴重造假
本來説只花5-6百萬美金(不到台幣2億)過沒幾
天漲價變花20億台幣。通膨好恐怖
你莫不是假裝 違反條款不訴訟能要幹嘛
違反了不起訴他 能讓他少根毛嗎xDD
今天openAI就一副要打法律戰了...
所以我跟你說別幻想用條款阻止起訴而已
很棒 你的意思是說openAI誣賴他嗎?
讚喔 但我是比較信微軟跟openAI
我記得講的是api
4
31
只有我看不是很懂嗎? 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI 競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何14
我比較好奇closeai怎麼證明對方有抄? 現在llm訓練出來的model都是黑盒子,沒人看的懂裡面結構 deepseek給closeai能拿來指控的只有他公開的原始碼和論文 這二個說是抄,那第一天就被抓出來了,還需要closeai出來吵? 至於有人說這個是證據的![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/A0TL3C8b.jpeg)
3
我用簡單說法看你有沒有辦法理解 首先中國很多ai研究都跳出來講了 這件事大有問題 沒錯,很多業者都用蒸餾法 但DS的原始模型感覺是拿gpt結果拿去背答案的12
一句話,對岸軟工不是抄就是疊,這次的DS沒意外就是LLM界的鴻蒙,我就問對岸到現在 有產出什麼作業系統 可以比肩 Unix/Linux 或Win的,基礎不行,疊床架屋倒是一流,過 年要大內宣,自己吹就好啦 ※ 引述《wenchinhsieh (windman)》之銘言: : OpenAI:已掌握DeepSeek盜用模型證據8
openai會崩潰完全不意外 會員想使用chatgpt最新版本每個月要花200美金 結果deepseek最新版本r1直接免費讓大家用 導致一大堆輕度使用者退訂chatgpt 以後gpt再放出任何更新更屌的新版本也沒用了![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/Z7twi0Sb.jpg)
8
DeepSeek為什麼要自爆? 抄襲就躲起來偷偷抄就好了,在被美國抓到之前,光靠抄襲就可以進步神速了 不要強調經費少、晶片少也就算了,居然還大加宣揚 那大家就會針對犯罪項目專項驗證 其他人講還有人不信,但是連馬斯克都出來講話了4
這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://observer.com/wp-content/uploads/sites/2/2025/01/GettyImages-1540568234.jpg?quality=80)
X
不要老是看藍綠白腦的台灣人怎麼說 我們來聽聽看對岸的同胞怎麼說 昨天就講過 蒸餾技術是甚麼 不懂的看完影片你就懂了![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://img.youtube.com/vi/SjHU3RG12c8/mqdefault.jpg)
9
在DeepSeek震撼全球跟美國AI股價時,霸氣嗆聲已掌握DeepSeek盜用openai 資料模型的o penai 公司,表示不會對其提告,會繼續專心做好自己的工作。 OpenAI真是佛心又大氣的公司! --![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/EwVqFNKb.jpeg)
5
好笑的是 前幾天推特陸續有人分享 用OPenAI新的o3-mini-high 中間推演過程會開始跑出中文 然後問它是不是有用什麼中國的AI模型![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/7Du9DQWb.jpg)
57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。![Re: [討論] 其實Deepseek真的很厲害了 Re: [討論] 其實Deepseek真的很厲害了](https://imgcdn.cna.com.tw/www/WebPhotos/1024/20250129/1200x800_wmkn_324524490661_0.jpg)
44
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/9N2QFY1b.png)
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
23
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/ey5mX61b.png)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
17
Re: [新聞] DeepSeek爆紅 藍委放話「台灣等著被智看這篇文章 -its-model-to-train-competitor/ai/amp/ 如果所言不假 那其實就是deepseek 拿人家的大模型訓練自己的小模型![Re: [新聞] DeepSeek爆紅 藍委放話「台灣等著被智 Re: [新聞] DeepSeek爆紅 藍委放話「台灣等著被智](https://cdn.unwire.pro/wp-content/uploads/2025/01/fb_photo-7.png)
12
[政治] DeepSeek盜用OpenAI ?本日政治文? (1/1) 總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI 是聊天機器人ChatGPT的開發商。![[政治] DeepSeek盜用OpenAI ? [政治] DeepSeek盜用OpenAI ?](https://money.udn.com/static/img/moneyudn.jpg)
8
Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對openai只有開源好幾年前的模型 現在meta google m$ 的開源模型都屌打好幾條街了 用過deepseek的人都知道,deepseek是蒸餾上面那幾個開源模型 況且deepseek也有把自己的模型和程式碼都公布出來 開源的精神不就是這樣嗎?3
Re: [黑特] 黃國昌真的不懂AI耶!不知道政府是怎麼買 但是如果直接買來用就不對了 資料是舊的查詢就沒有意義了 所以應該要 方式一:API + 私有資料庫整合