Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據
※ 引述《zzahoward (Cheshire Cat)》之銘言:
前文恕刪
: 看到這東西,反正是開源的,程式碼都攤開在那邊給你看
: 應該是要想著怎麼去利用,而不是討論中/美或成最大贏家嗎?
: 怎麼搞到變成政治意識形態的爭執了?
: 有些推文一直扯到超導體,我就不懂有什麼可比性...
: 本身有一點點計算機概論底子加上英文能力就可以去稍微理解這東西
: 結果很多人都只用台灣媒體或網紅的貼文去判斷,這個邏輯不太行阿
網紅要的是流量 台灣媒體要的是點擊率和收視率
大家現在拿chatGPT來幹嘛 不就用同樣的方法檢視deepseek?
要求在媒體 或者社群媒體上看到討論技術性的文章只能說.....
個人從沒這種奢望拉
八卦版 不就政治意識形態 股版是要標的賺錢啊
或許技術開發者會感到某種興奮?
但現實中不是專業人員
根本不可能從影片或文章中就突然變得很厲害
那麼瞭解是要?? 就算技術再厲害
公司能不能獲利又是一回事 投資者能不能獲利又是另一回事
關於模型印象中之前股版討論
輝達的GPU 和CUDA 其實就有拉到open ai的相關討論了
架構再怎麼簡潔 但最後都還是會繞回算力的討論
不過在股版麻 關注重點自然是獲利阿
目前確定知道賣鏟子能賺錢
剩下的不知道阿
--
※ PTT留言評論
57
DeepSeek這玩意不管是真是假,但的確撼動到US金融市場 所以過去24小時的劇情是這樣發展的 1.正在為聯邦預算頭痛的DOGE馬,開了第一槍,畢竟社保基金還一籮筐在 股市,這錢無論如何是不能賠的,NVDA不小心搞崩,會帶垮七仙女的 先不管有沒有驗證,既然屁股在那裡,先喊詐騙再說44
比較好奇這段: 儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何 OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。 各個ai 大語言模型不是都會互相參照比較和訓練嗎? 我以為這是業界常識…23
各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣 AI = 模型的程式碼+訓練 能開源的部分只有程式碼, 訓練是看各自調教 模型的能力夠, 差不多的調教方式就會得到差不多的結果 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強16
現在全網路上的開源數據資料是屬於pre-training端 大多都是野生數據 無標籤 那東西只是讓模型去向鸚鵡一樣 去做文字接龍 但第二階段訓練會用到RLHF (Reinforcement Learning from Human Feedback) 就是要人類針對不同數據給意見 這個是要給標籤 所以你才會聽到狗家之前要求全公司員工去給意見讓Gemini前身 Bard 去做人類feedback32
各位是不是忘了 中國人文化 先說ㄛ 我沒深究 但我六年前影像的 我猜原理應該還是差不多 AI 發展幾十年 論文裡從沒看過 模型能只接把算力幹掉90%的 偏偏中國人就可以,雖說中國人也發表過幾篇幾十萬引用的優秀模型 但經典開源模型裡 通常會給出爆
以下部分資訊來自於Reddit anitakirkovska文章的翻譯 LDPC哥哥講到一個重點 Reinforcement Learning =/= Reinforcement Learning from Human Feedback 這也是R1為什麼爆紅的原因50
OpenAPI 的 Chief Research Officer (首席研究員) Mark Chen 2025/01/29 凌晨發了一波推文評價 Deepseek R1 的論文 恭喜 DeepSeek 產出了一個 o1 級別的推理模型!他們的研究論文顯示,他們獨立發現了7
這篇文章的核心意思就是 我們掌握著一些竅門,可以提升回答質素的那些,我們早就實踐,而且怕被快速追上,所以把他們閉源了 但是這些訣竅被中國人自己研究出來了 還有一些技巧,早就可打破一味堆算力的瘋狂勢頭,但是為了保護美國七巨頭現在 極好的股票上升勢頭。我們把它們擱置了,ds一出,我們不得不把低成本部署的算法都拿出來準備實施了
爆
[爆卦] 數發部次長造謠Deepseek成本不只550萬鎂補充:數發部次長刪留言了 懶人包: 某位財經網美發文說deepseek 就是騙局,而且根本是抄襲的次等chatGPT 底下數發部次長(林X敬)留言表示他們2048片H800根本不只這個錢,但是被打臉了(已刪 留言)57
Re: [討論] 其實Deepseek真的很厲害了OpenAI:已掌握DeepSeek盜用模型證據 (中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日 增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek 握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。31
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據只有我看不是很懂嗎? 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI 競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何20
Re: [問卦] 為什麼deepseek會影響台積電 不懂?DeepSeek厲害的地方不是他便宜,不是他厲害,最重要的地方是他開源。 他的原始碼開源,權重開源(資料沒有開源),而且開放商業授權,他的 原始碼是MIT授權,權重則是基於OpenRail的特殊開源架構,也就是只有 一些特別場合他沒有授權,例如製造有害軟體,製造毒品等等 簡單來說你現在馬上就可以在你的電腦,你的公司使用了,你只要用很普20
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據Deepseek主打就是蒸餾法,就是高效的AI抄襲工具 哥爾D系柯 不只要抄,還要開源 開起來大抄襲時代 人人有600萬就能參加慈善AI抄襲大賽12
[政治] DeepSeek盜用OpenAI ?本日政治文? (1/1) 總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI 是聊天機器人ChatGPT的開發商。X
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據Open AI真的提出了證據再說,而且我比較好奇的是,本來我以為Open AI第一時間應該會 出面駁斥的是DeepSeek訓練成本不可能這麼低的事,結果竟然是在指控對方盜用模型。 說真的,對於世界上廣大的公司來說,比較關心的事是否真的能用那麼低的成本來建構出 一樣的東西,如果可以,那麼之前要耗費大筆金錢再搞AI的公司不就是傻子? 到底Open AI骨子裏是知道事實的(就是本來成本就不用這麼多),又或者DeepSeek宣稱X
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據一天前,綠共閩南台派 還處於挨打的狀態 猶如黑悟空甫推出的幾天那時的情景 八卦版還可以光明正大的質疑: 為什麼中國不自由卻做得出3A? 外國看起來黑神話也引起轟動!?X
Re: [黑特] 有一說一 拿政治歷史問題去問ai的都是87?這邊應該要說的比較清楚的是模型的背後其實就是統計建模的概念,不管是LLM或vLLM都是 。像LLM越是沒有信心的知識在取樣下一個Token時越難取樣出事實,所以模型其實是很好控 制的,越是複雜或是有爭議的事件模型除非人工強化不然他就越容易產生幻覺(Hallucinat ion)。所以拿某些歷史尤其是冷門的歷史事件或政治人物他越不容易回答正確。 不過模型也需要為人服務,所以當初不管OpenAI或是DeepSeek 再訓練時才會引入強化學習
70
[情報] 114年02月19日 三大法人買賣金額統計表98
Re: [請益] 戰爭時的資產安排31
[標的] 3037 欣興AI未來多26
[標的] 00712有點猛29
Re: [新聞] Trump threatens 25% tariffs on fo26
Re: [新聞] 獨/蛋價腰斬飼料又漲蛋農雪上加霜 盼提9
Re: [新聞] 美俄結束停戰會談!川普控「烏克蘭先對俄32
[標的] 1789 神隆(第四次)18
Re: [新聞] 「陶朱隱園」宣布正式開賣 單價估300萬19
[標的] 蛇年中小多9
[情報] 0219 上市投信買賣超排行9
[情報] 是方(6561.TW) Q4 4.097
Re: [請益] 戰爭時的資產安排15
[請益] 國泰複委託交割問題26
Re: [標的] 3227-原相 股版首發2
Re: [新聞] 全包了!台積電一口氣買下全台最大風場20X
Re: [新聞] 獨/蛋價腰斬飼料又漲蛋農雪上加霜 盼提3
Re: [新聞] 美能源部長:2050淨零排放是邪惡的目