Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
我用簡單說法看你有沒有辦法理解
首先中國很多ai研究都跳出來講了
這件事大有問題
沒錯,很多業者都用蒸餾法
但DS的原始模型感覺是拿gpt結果拿去背答案的
這各有很多證據證明,
回答答案很多都像兩年前gpt
開源是程式碼,但這個可能是拿人家沒釋出的東西訓練
這會發生什麼問題?
你確實省了前面步驟,省了不少錢
但問題是gpt是你的老師
老師是拿H100
老師知道問題理解過程,
那你學生只會背答案有用嗎?
更何況馬斯克都講了
他偷用H100
如果是真的那就大條了
看看大陸手機市場
美國絕對會提升出口限制
不要再吹遙遙領先了
快破了!
※ 引述《a40494 (田埂牧者)》之銘言
: 只有我看不是很懂嗎?
: 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI: 競
: 爭,將違反OpenAI服務條款,因此產生疑慮。
: OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何: OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」
: 先說蒸餾技術是AI接常用做法
: 又說婉拒近一步說明且沒提供證據
: 然後說OpenAI的用戶不得複製,但DS不是開放下載嗎?為什麼沒有證據?
: 再來是「利用輸出結果,來開發與OpenAI競爭的模型」
: 你如果沒辦法證明DS是複製你的程式,請問要怎麼符合「利用輸出結果」這個條件?
: 如果有抄就有抄
: 但你總要提供他真的有抄的證據吧?
: ※ 引述《wenchinhsieh (windman)》之銘言:
: : OpenAI:已掌握DeepSeek盜用模型證據
: : 2025/1/29 20:59(1/29 21:05 更新)
: : 譯者:楊昭彥/核稿:施施
: : https://www.cna.com.tw/news/aopl/202501290140.aspx
: : (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮: 日
: : 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSe: ek
: : 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。
: : 中國的DeepSeek因標榜低成本也能訓練出強大人工智慧(AI)模型,顛覆AI訓練不能沒: 有
: : 精密昂貴晶片的刻板印象,引發市場強烈震盪。
: : 不過,總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(Fin: an
: : cial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。: Op
: : enAI是聊天機器人ChatGPT的開發商。
: : 蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,: 並
: : 讓他們在特定任務上以更低廉的成本得到類似結果。
: : 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI: 競
: : 爭,將違反OpenAI服務條款,因此產生疑慮。
: : OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任: 何
: : OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。
: : 彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正: 在
: : 調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資: 訊
: : 。
: : 報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出: 大
: : 筆數據,他們認為這些人可能與DeepSeek有關。
: : 美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中: 提
: : 及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自: 家
: : 技術,但他也沒有進一步提出證據。
: : 另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多: 達5
: : 讓他們在特定任務上以更低廉的成本得到類似結果。
: : 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI: 競
: : 爭,將違反OpenAI服務條款,因此產生疑慮。
: : OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任: 何
: : OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。
: : 彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正: 在
: : 調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資: 訊
: : 。
: : 報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出: 大
: : 筆數據,他們認為這些人可能與DeepSeek有關。
: : 美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中: 提
: : 及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自: 家
: : 技術,但他也沒有進一步提出證據。
: : 另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多: 達5
: : 萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk): 也
: : 在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。
: : 由於H100晶片被禁止向中國出口,這形同直接挑戰美國出口管制政策。有分析直指,De: ep
: : Seek繞道囤積大量晶片以規避美國管制,因此其真實開發成本恐怕遠高於宣稱的558萬: 美
: : 元(約新台幣1.83億元),未來也勢必將引發美方加強管制。(譯者:楊昭彥/核稿:: 施
: : 施)1140129
: : 備註:看來塵埃落定,我們的NVIDIA和台積電今晚應該要蓄勢待發了吧‼
----
Sent from BePTT on my Samsung SM-S9260
--
看模型內有沒有防盜噴碼,調出來知道了
你知道自己在說什麼嗎 還背答案==
反正美國一定找理由禁 有差嗎?
開源的軟體怎麼禁..
背答案是三小?
原來不只我看不懂你在寫什麼
LLM答案能用背的?
背得完喔?!
?
"感覺" 好喔
不懂就講 不用出來告訴大家你不懂
確實 有看到網路上有人問模型他回openai
這個還好,問題是請derpseek講一個笑話 結果他回答跟兩年前gpt很像,這件事比較怪
※ 編輯: signm (114.40.44.158 臺灣), 01/29/2025 22:19:43你這篇比較像AI你知道嗎?
背答案....
就中國最厲害的盜版盜到變自己才是正版
可憐
你請他講笑話就是你的不對了
我就當作你是真不懂
deepseek寫得很清楚 是特定領域用
也就是只有在他有練的領域能比肩o1
你叫他講笑話 就是找他沒練的領域
那自然就是只有舊資料 沒練過
嗯嗯 對 背答案 笑死
藍白粉還不下車
「馬斯克講了 他偷用H100」?
你這麼說有證據嗎?還是只是隨便看
外媒報導錯亂翻譯成中文的扭曲報導
馬斯克怎麼會公開說這種話?
h100跟馬斯克有什麼關
藍白浮木一天消失 阿北也消失了
你文組?
你要不要聽聽看 你自己在講什麼
31
只有我看不是很懂嗎? 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI 競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何14
我比較好奇closeai怎麼證明對方有抄? 現在llm訓練出來的model都是黑盒子,沒人看的懂裡面結構 deepseek給closeai能拿來指控的只有他公開的原始碼和論文 這二個說是抄,那第一天就被抓出來了,還需要closeai出來吵? 至於有人說這個是證據的![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/A0TL3C8b.jpeg)
12
一句話,對岸軟工不是抄就是疊,這次的DS沒意外就是LLM界的鴻蒙,我就問對岸到現在 有產出什麼作業系統 可以比肩 Unix/Linux 或Win的,基礎不行,疊床架屋倒是一流,過 年要大內宣,自己吹就好啦 ※ 引述《wenchinhsieh (windman)》之銘言: : OpenAI:已掌握DeepSeek盜用模型證據8
openai會崩潰完全不意外 會員想使用chatgpt最新版本每個月要花200美金 結果deepseek最新版本r1直接免費讓大家用 導致一大堆輕度使用者退訂chatgpt 以後gpt再放出任何更新更屌的新版本也沒用了![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/Z7twi0Sb.jpg)
8
DeepSeek為什麼要自爆? 抄襲就躲起來偷偷抄就好了,在被美國抓到之前,光靠抄襲就可以進步神速了 不要強調經費少、晶片少也就算了,居然還大加宣揚 那大家就會針對犯罪項目專項驗證 其他人講還有人不信,但是連馬斯克都出來講話了6
這段一定很多人沒看懂。 正確的說法是,蒸餾可以讓較小的模型(學生)在特定任務上得到比原本的小模型更好, 近似於大模型(教師)的結果。 近似,就不可能比教師模型更好,只會更差。另外由於OpenAI沒有開源,所以這種叫做 黑箱蒸餾。如果可以蒸餾把模型變小可以維持原來的品質,那就一直蒸餾一直蒸餾蒸餾![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/uznnxpcb.jpeg)
4
這裡的說法如果是正確的話,那DeepSeek就不是只靠蒸餾來達成的. Scale AI’s 28-Year-Old Billionaire CEO Warns About This Scarily Good Chinese Startup 這個CEO就是指控DeepSeek事實上擁有並使用50000個H100 GPU的人.![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://observer.com/wp-content/uploads/sites/2/2025/01/GettyImages-1540568234.jpg?quality=80)
X
不要老是看藍綠白腦的台灣人怎麼說 我們來聽聽看對岸的同胞怎麼說 昨天就講過 蒸餾技術是甚麼 不懂的看完影片你就懂了![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://img.youtube.com/vi/SjHU3RG12c8/mqdefault.jpg)
9
在DeepSeek震撼全球跟美國AI股價時,霸氣嗆聲已掌握DeepSeek盜用openai 資料模型的o penai 公司,表示不會對其提告,會繼續專心做好自己的工作。 OpenAI真是佛心又大氣的公司! --![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/EwVqFNKb.jpeg)
5
好笑的是 前幾天推特陸續有人分享 用OPenAI新的o3-mini-high 中間推演過程會開始跑出中文 然後問它是不是有用什麼中國的AI模型![Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據 Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據](https://i.imgur.com/7Du9DQWb.jpg)
67
Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也應該不用那麼久 重點是DS是開源的 現在應該有許多數據中心已經開始實驗DS的演算法 我們先假設DS的創新 是往AGI道路上的王道![Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也 Re: [新聞] DeepSeek R1來了,追平o1!它現在不但比OpenAI開放,也](https://i.imgur.com/OBFxyQJb.png)
54
Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未Deepseek用更多輝達晶片有兩條路 第一、用更多H100,輝達跟這個ai產業鏈股價崩盤, 現在市場給輝達跟Ai產業鏈的股價是基於必須生產更高階的晶片, 如果Deepseek證明大型ai模型只需要H100等級的晶片就足夠, 那市場還會買單gb200、gb300甚至輝達說一年隔代一款ai伺服器的構想嗎?![Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未 Re: [新聞] 市值蒸發19.7兆!輝達聲明:DeepSeek未](https://i.imgur.com/N5n7y8Ob.jpeg)
55
Re: [閒聊] ChatGPT是語言模型不是搜尋引擎本來沒想這麼早回這篇的,不過既然都有人把討論串回起來了我丟點資訊, 既然都會看網紅發表對ChatGPT的看法(沒有貶義),我覺得也可以看看這個: 台大電機副教授李宏毅老師的ChatGPT講解(先回到PTT還是學術論壇XD) ChatGPT (可能)是怎麼煉成的 - GPT 社會化的過程![Re: [閒聊] ChatGPT是語言模型不是搜尋引擎 Re: [閒聊] ChatGPT是語言模型不是搜尋引擎](https://img.youtube.com/vi/e0aKI2GGZNg/mqdefault.jpg)
47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。![[討論] Deepseek就之前吹過頭了呀 XD [討論] Deepseek就之前吹過頭了呀 XD](https://i.imgur.com/94BvQMzb.jpg)
18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。![Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援 Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援](https://i.imgur.com/wNCJOYBb.jpg)
10
Re: [閒聊] OPENAI出現前,OPENAI出現後完全看寫什麼程式 和自己是否了解自己要幹嘛 TLDR; 寫網路上能找到範本的程式 做一點修改 ai可以做的不錯 省去自己慢慢爬文的時間![Re: [閒聊] OPENAI出現前,OPENAI出現後 Re: [閒聊] OPENAI出現前,OPENAI出現後](https://i.imgur.com/zeyWE3ab.png)
X
Re: [問卦] 中研院自己做的大型語言模型怎麼了?這語言模型基礎是建構於Llama 2,meta提供的開源模型 另外Atom 7b則是中文社群跟一間中國公司在Llama 2之上訓練成中文使用者適合的模型, 也是開源且開放商用 技術上也不用解釋太多,反正開源模型他本來就不會像GPT或百度的文心一言那樣限制某 些爭議性回答![Re: [問卦] 中研院自己做的大型語言模型怎麼了? Re: [問卦] 中研院自己做的大型語言模型怎麼了?](https://i.imgur.com/GQlNhZjb.jpg)
3
[問卦] 為什麼台灣人關注的點都很奇怪deepseek重要的點不是他省資源與開元嗎 結果台灣人一堆跑去試伺服器在中國大陸的服務 然後說有監管 廢話這個當然有監管 這個需要試嗎 還有在自己本地跑模型 然後說沒有監管 這個叫做破解 破解個毛 人家就開源的
Re: [閒聊] Deepseek的角色扮演Deepseek目前是有同時釋出開源模型(權重、Code、訓練模型的方法報告都開源)的,走跟 llama一樣的路線,所以理論上只要GPU卡夠你就可以建一個完全一樣的環境包含重新微調模 型讓DeepSeek 做瑟瑟的事情跟串接對話還有Agent去執行任務。 目前初步測試繁中能力真的屌打一堆拿喇嘛微調的台灣llama模型,重點是MoE的架構可以很 省GPU(如果是llama同精度需要32張H100卡才能佈起來)。其實這次比較新釋出的是他的R1