Re: [討論] 其實Deepseek真的很厲害了
OpenAI:已掌握DeepSeek盜用模型證據
https://www.cna.com.tw/news/aopl/202501290140.aspx
(中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。
中國的DeepSeek因標榜低成本也能訓練出強大人工智慧(AI)模型,顛覆AI訓練不能沒有精密昂貴晶片的刻板印象,引發市場強烈震盪。
不過,總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(
Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI是聊天機器人ChatGPT的開發商。
蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並讓他們在特定任務上以更低廉的成本得到類似結果。
儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競爭,將違反OpenAI服務條款,因此產生疑慮。
OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。
彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正在調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資訊。
報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出大筆數據,他們認為這些人可能與DeepSeek有關。
美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中提及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自家技術,但他也沒有進一步提出證據。
另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多達5萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk)也在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。
由於H100晶片被禁止向中國出口,這形同直接挑戰美國出口管制政策。有分析直指,
DeepSeek繞道囤積大量晶片以規避美國管制,因此其真實開發成本恐怕遠高於宣稱的558萬美元(約新台幣1.83億元),未來也勢必將引發美方加強管制。
(譯者:楊昭彥/核稿:施施)1140129
挖要出大事了嗎 是不是有大場面可以看了
--
哈 OpenAI急了
樓下說不給晶片是不是怕輸不起
「蒸餾」(distillation) 跟複製盜用應該還需要證據
中國偷技術也不是一次兩次了
看OpenAI最後抓到什麼東西吧?
樓下說急了
被盜用當然急啊^^
我覺得等OpenAI調查能挖到什麼結果吧
也只有中國人會這樣把偷來的東西說成是自己發明的
果然還是要用一堆nv 硬體才算的出來,老黃穩穩的
我樂子人等消息 這麼多人急著站隊嗎
今天之前 有些看法是實際運算量沒這麼低成本
這只是要安撫股東 因為退訂的太多 closeAI被看破手腳
看不懂,反正還能用就先用
美國版的deepseek要賣50%給美國企業
我最喜歡血流成河了.jpg
笑死 openai就沒盜嗎w
我是覺得沒必要站隊
當然站隊啊,看棒球也是先從決定要支持哪個棒球隊開始(X
剛好我看中職現在也沒啥在支持球隊了
從球隊迷轉成球員迷輕鬆自在
這個只是安撫股東沒錯 實際上沒屁用
抄來便宜用在大外宣
因為 deepseek真正打擊到openai的是他們的論文
跟他們已經開源可以對照論文的研究成果
deepseek本身已經是用完的東西 擺著給你用而已
deepseek = 開源版open ai ?
這殺傷力...
不等於 差很多
deepseek做的事情 是用小的模型 在特定的領域
做到能跟openai的o1接近能力而已
優點就是他模型小 所以他訓練起來便宜 算力需求低
缺點就是 他是特定領域用的 超出領域一概不會
可以說從理念上就跟chatgpt是完全不同方向的產物
你要說他抄襲怕是一點基礎都沒有
openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大
降價?
感謝樓樓上的分析
結論來說 大概會是這樣 所以實際損失的都是openai
對於其他普羅大眾 跟其他AI開發者 都是好事
他們有附論文 deepseek其實只是他們的研究報告
大概只有沒什麼常識的覺得openai還可以靠吉人這招
挽回劣勢吧
吉人最多只能讓openai回收一點錢 沒有其他用
OpenAI(青春版)
因為這一刀傷害是永久性的 事實被戳穿了
實際上deepseek這個路線更符合商業用途
openai本來是放消息說他們2030之前想要花2000億美
元開發ai
做賊的喊抓賊==
不會被打死但要被大砍一刀
這個意思就是告訴投資人你要投資我到這些金額
其實不太有「超出領域一概不會」這件事ㄅ 非distilled 版
本的參數其實也不小了
現在的爭議是宣稱的開發成本造假嗎?
嘛 你可以說 超出領域 約等於沒特別訓練過
現在ds出來基本代表這個投資計畫不會再有2000億美
元的可能性了
一概不會就誇飾 這樣 他就唬爛你而已
畢竟本身還是那個聊天機器人 沒訓練下就那樣
說是研究報告不如說是火力展示更為貼切ㄅ 他們還是有在 A
PI 上面做收費的
不過那個價格真的是甜了很多 比起openAI 更像是在推全世
界的 AI 福祉==
急了
我的意思是「超出領域就不會」可以適用於所有 LLM,不是
只有 DS 才有這個特徵,抱歉沒說清楚
以下是我聽我哥說的 信不信自己判斷
據說這家本職就不是做AI的 他們是靠金融買賣賺錢的
它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢
然後這次他們買了太多為了訓練這AI的算力
所以多出來的就丟給技術部做研究 反正擺著也是浪費
openai也不會多傷吧,這行業仍然是大者恆大
這個deepseek就是它們研究成果 這樣
全世界AI福祉 ?
是不是越來越奇怪了 變成多買的算力順便研究??
所以那550萬美元本身就是他們多買的算力而已
然後開源也是因為這就技術研究 不是主產品 隨便你用
那個天才工程師和天才創辦人也是順便的?
畢竟是支
本來就是福祉阿 本來要宣稱要花幾千億美元才能推動
現在有只花1%一下金額的能做到了 能投入資金的門
檻低那麼多就會有更多人來做
噱頭吧 反正炒一炒無傷大雅阿
他們收的錢就只是算力不想給你免費用而已
畢竟你直接用是用他們的算力阿 收你基本費不過分吧
你拿開源模型回去自己用他才不管你了
你就說 這是不是才是真正"OPENAI" 該有的樣子
論文給了 模型給了 你想試用也給你用了 還想怎樣
對某些人來說可以便宜推動世界進步的技術不重要 出
產國家是哪個比較重要的概念
原本OpenAI可以閉源只給人接API,就算meta丟出LLaMA也是遠
老黃大勝利
不及OpenAI的效果,靠著接API穩定賺的錢忽然被deepseek開
openai先說拿了哪些東西訓練,我們再來講“偷”這件事
源砍了一大刀,原本宣稱需要的巨額投資被戳一下就洩氣了。
當然是連算力都免費給人用啊,鄉民當然什麼都想要免費
偷網路上的東西訓練模型來賺錢,還閉源...
世界進步呵呵
中國人的反駁怎麼都一樣啊 人家問你有沒有打老婆 你
就反問對方沒打老婆嗎
DS開源才是對openAI打擊最大的
證明真的小粉紅還是比數位小粉紅好用
討論這種議題還想在那邊跳4-11吼也只能說就這樣了
啦 呵呵
八卦有人講得更清楚點 deepseek重點是方法論不同
所以實際上你拿任何模型都能用那方法論提升訓練校率
openAI之所以閉源 是為了藏他們提升效能的指導方式
deepseek的路線就不需要指導方式了 所以不同
黑市什麼都買得到,管制就是笑話
但是ds提升的只有減低成本,要品質還是出不來的樣子?
這樣就中國人了喔,可悲政治腦...
品質就論文說的 在特定領域確實能訓練到跟o1一樣強
而且某方面來說前後文對照還更強一點
撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧
然後 在AI領域 降低成本不太是"只有" 的問題
老實說我懶得對會相信deepseek拿訓練好資料的人解釋
論文都在那了 拿別人資料是有啥用處
沒人在跟你講話啦 要回那麼大一串怎麼不乾脆回一篇
沒欠你啊 幹嘛要浪費我時間發一篇
OpenAI都沒開源是要怎麼抄襲?
台灣真神奇 沒開源的東西一堆人相信有被偷 然後公開
的論文被抄襲反而卻有不少人護航
老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問
了
稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快,
他論文有寫用什麼比 跟什麼模型比 評分個是多少
現在才兩日就開始跑破解流程了
所以不信可以自己去試試看
在這下面回了快一個小時 時間還真寶貴啊
回推文跟回文要的時間差距難道要我教你?
你們在這吵好像也沒有辦法驗證誰對誰錯啊
都開源免費使用,真有抄襲證據應該很好抓吧,而且一
堆研究者查不出也難莫名的
我個人認為 至少效能這部分如果是假的早就被公開了
真的有抄襲早就一刀斃命了
這麼多人去試 評分是假的應該不難測出來吧
至於成本 這只能說就你信不信囉 方法論寫在論文
等別人試論文的方法論能不能複現吧
如果以陰謀論來猜想,假設復現需要相當的時間及成本,等
證明為假之時是否有炒作股票套利的空間可能?
想吵是建議去股版啦 推文這串在股版都講到爛了
我不能說沒有 但我是覺得為了搞這套也太大手筆
看新聞講市值蒸發多少多少,好像為此而大手筆也不為過?
畢竟是支那
都幾乎全開源給你看了 論文也有 跟裸奔沒兩樣 其實光這樣
質疑的聲音就小很多 也是為什麼全世界整個炸開的原因==
一些相對沒根據的質疑是真的大可不必
效能要是假的也太難 livebench 這種第三方測試的都表示真
的強如鬼神了
抄襲看笑話 沒抄爽用開源模型 都好
主打的就是一個我不了解但是我硬要嘴的概念嘛 習慣
就好
抱歉好奇伸手問個,
DeepSeek是開源到連model都能自己載來玩嗎?
還是單純把他的方法寫成paper?
喔喔,找到GitHub頁面了,竟然有欸,沒事,你們繼續(x
謝謝中國膠的表演
答案是 都有XDD
Deepseek免錢 我站DS
我只關心什麼時候會有基於Deepaeek的瑟瑟模型
原來可以藉由API的output去微調其他模型? cool
挖乾,看了一下,他好幾個模型的license都沒有擋商用,
不確定是不是正常(我對open source規則不熟)
這樣子感覺未來的潛力很可怕耶,市場真的要亂掉了ww
AirPenguin看起來好急喔
希望不是像Mamba那樣曇花一現
我也覺得蓋大樓不如回一篇 這很正常
順帶一提,有看到不給軍事用途,但真的用了哪抓得到w
喊很急不如多回點內容
都是到處爬了一堆沒授權,旁邊看戲就好
都開源了 就是給大家研究 他們自己會不會研究不知道
我不想回文兩個原因 1.費時 沒欠你 2.我也不是專業
基本上全是自己理解 你自己去查不會差到哪去
除了我哥說的那段公司拿剩餘算力來做的可能查不到外
其他的怕是你自己查可能更正確
我說我覺得他說的對 不是要你回文 你沒欠我沒錯
所以我覺得整理我說的話沒意義 這樣
但如果那個說法屬實,他開源出去反而會影響到本業吧
拿來弄股票的人一多,本來的模型就不準了
等於是拿石頭砸自己的腳,除非他覺得改靠賣API賺更多
有技術報告也有Github啊 openai告了頂多跟DS討錢
但東西都開源了 技術散播出去也收不回來了
可能性很多 例如他的模型也有考慮過這個了
急了
他開源出去又不會污染到原本的資料集,可以當成分叉就好。
或是他們蠢沒想到這層 或是 我哥胡說我也跟著胡說
因為不是本業,所以可以靠低價入市+開源打廣告。
這種東西開源就跟把辟邪劍譜印了10萬份
散播到整個江湖去一樣
最有價值的確實就是論文沒錯
開源就是論文附的示範品這樣
已經開始有企業導入DS來用了,免錢這點優勢真的很大
至少個人認為這對AI發展是好事啦
還在著重套模的我覺得太小看DS了 他是有說明怎麼做的
不管是應用面還是開發面 都會成長不少
遙想手雕晶片
OpenAI自己都不敢公布訓練用到哪些source了
只會說一切來源合法合規
笑死,不能幹openAI輸出的結果訓練,阿你訓練GPT的
data哪來的,請一堆科學家幫你寫的逆
這領域我是不知道誰有臉跳出來喊人侵權啦
但是github是微軟主場,會不會出陰招強迫閉源呢?
GitHub只是一個倉庫 被擋用別家不就好了
急了 證明DS殺傷力很大
我有證據 但是我不跟你說 名嘴嗎?
要有證據才能說人家打老婆吧,Excel打老婆嗎
這不就沒證據出來安撫股民的,真的告了再來談好嗎
我覺得這看下去就知道 但台灣很奇怪的是
一堆人急著跳出來批評 出發點是因為那是中國做的
股民請保持信心XDD
OpenAI還沒上市吧
人家開源 高大上
我有證據但我不能公布,好怪
逢中必反蟾蜍又來了
那你close ai 怎麼拿不出同樣的成果
逢支必舔人 啟動
openai的推理模型又沒開源怎麼distillation,買訂閱一
直瘋狂問嗎ww
15
首Po以下是以古典RPG框架設計的熱血故事大綱,分為四幕結構,約1000字: --- ### **故事標題** **《蒼炎之絆:破曉的誓約》**2
我個人看最近的網路啦 感覺就像是GPT剛出來的時候一樣,各種哇哇哇好厲害好好玩的文 可能因為價格成本壓的更低了,加上是以中文為主所以在華文圈又進一步拓寬受眾了吧 有競爭真的是好事,AI越來越便宜,發展速度也進一步加速,廠商都有危機意識之後就是我 們廣大消費者受益了38
原文43 因為這兩天此AI似乎很火紅 也試玩了一下 發現有的問題回答腦洞還挺大的 這邊給大家看一下 題目是:3
請他解讀最近又紅起來的西羅哥 這差不多是以前可以拿去網路上假裝自己是大大的等級了 專業術語很多但是廢話很少說的又很精闢 Q 你覺得Z鋼彈中的西羅哥是一個什麼樣的人?請用繁體中文深度回答我,謝謝你。5
魯宅如我只想問 Deepseek可以接諸如傻酒館之類的東西 然後跑眾多肥宅寄與厚望的那個嗎? 不管是API或本地部署都好 不過本地部署偶的ram只有8G 跑不動5
大量男性自宮 為什麼是女尼姑話話語權提升啊? 真要說的話不應該是少林寺提升?或是大量和尚還俗?我覺得和尚還俗都比尼姑power up合理啊 怎麼會是需求變少了,結果尼姑的影響力卻變大了?這不合理吧? -----10
GPT應付不了的問題☠☠ Input: 5個人過河分別是 媽媽 爸爸 哥哥 妹妹 路人 媽媽是魅魔會單獨與男性在一起時對男性進行侵犯 爸爸是鬼父單獨與妹妹在一起時會進行侵犯3
看一些評論 deepseek有一點較特殊的是在於 特意篩選主題後減少資料量來讓較低硬體也能較快運算 也就是當判斷現在聊的主題是偏向那種類型時 則選擇較小資料庫來做運算,讓較低階硬體能即時輸出堪用的結果12
DeepSeek可以下載到自己電腦跑、ChatGPT不行, 這在商業使用的場景上就有蠻大的差異 昨天很多人在傳說用(線上版)的DeepSeek會把資料傳給中國,這當然是對的, 但過去一兩年我們幫客戶評估AI專案時, 在串GPT-API上常常會碰到我們或我們的客戶其實也不想把資料傳給OpenAI,12
剛剛看到的消息 Coming soon: Customers will be able to use distilled flavors of the DeepSeek R1 model to run locally on their Copilot+ PCs. 即將推出:客戶將能夠使用 DeepSeek R1 型號的精簡版本在他們的 Copilot+ PC 上本地運行。 微軟說以後的windows會有內建的DeepSeek AI系統
爆
[心得] DeepSeek對AI產業鏈影響懶人包最這幾天股板跟 X 上的AI金融圈吵的火爆 DeepSeek 對全球 AI 技術發展影響 吵的火爆示意圖 金融人士擔憂影響38
[問卦] 財經網美說Deepseek開發成本謊報中國AI公司DeepSeek(深度求索)以低晶片數開發出與OpenAI O1相當的新模型,經過查 詢成本降低98%引外界矚目,對此財經網美胡采蘋認為,DeepSeek的母公司「幻方量化」 聲稱,他們是用A800、降速晶片開發,這根本是無從驗證的說法,且Deepseek沒有報上背 後語言模型的成本,開發成本必然是謊報的。 但deepseek成本降98%指的根本不是開發成本47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。31
Re: [新聞] OpenAI:已掌握DeepSeek盜用模型證據只有我看不是很懂嗎? 「儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI 競 爭,將違反OpenAI服務條款,因此產生疑慮。 OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何31
[請益] OpenAI的敵人難道只有一個DeepSeek嗎?前幾天的美股真實上演狼來了,嚇得投資人四處逃竄 昨天開始各家執行長靠大內宣穩住士氣。 搞得像邪教(信仰)一樣,還讓人一度以為是佈道大會。 DeepSeek的出現,是不是足以能構成OpenAI的威脅這一點 跟它的性能(算法)跟成本(算力)好壞已然無關。22
[轉錄] 許美華 FB DeepSeek說謊1.轉錄網址︰ ※ 請附上有效原文連結或短網址 ※ 2.轉錄來源︰ ※ 推特/FB 須為 FB人物名稱、FB粉絲團名稱 ※18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。17
Re: [新聞] DeepSeek爆紅 藍委放話「台灣等著被智看這篇文章 -its-model-to-train-competitor/ai/amp/ 如果所言不假 那其實就是deepseek 拿人家的大模型訓練自己的小模型12
[政治] DeepSeek盜用OpenAI ?本日政治文? (1/1) 總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI 是聊天機器人ChatGPT的開發商。8
Re: [新聞] DeepSeek暴紅不單純?OpenAI質疑中國對openai只有開源好幾年前的模型 現在meta google m$ 的開源模型都屌打好幾條街了 用過deepseek的人都知道,deepseek是蒸餾上面那幾個開源模型 況且deepseek也有把自己的模型和程式碼都公布出來 開源的精神不就是這樣嗎?
爆
[閒聊] 丁特!是用哪間代儲啊爆
[問題] 魔物獵人超新手要玩什麼武器?爆
[25冬] Ave Mujica 07 心得爆
[妮姬] 海倫 新轉盤Skin「浴後」爆
[閒聊] 日本泡麵廣告炎上 (被女權)78
[閒聊] 棋靈王 越智為何老看不起進藤?68
[母雞] 沒辦法好好靜下心來看愛爽本了怎麼辦65
[閒聊] 鋼鍊哪首最能打?61
[母雞] 初華也太正56
[閒聊] 哇靠!照君臨也太美了吧!54
[閒聊] 法環黑夜君臨主角馬娘說52
[閒聊] 如果 FF7要切成兩部怎麼切?54
[講談] 燃油車鬥魂 完結51
[閒聊] PTCGP 赤日真的是一張爛牌嗎?49
[閒聊] 母雞卡全員性轉成公雞卡怎麼演?49
[閒聊] 妮姬 EVA連動立繪有比第一次好嗎?51
[鳴潮] 除了龍鳳蝶花還有必抽的嗎?40
[母雞] 如今的天火降臨跟市場決策脫不了關係41
[討論] 外傳、前傳比本傳紅的作品?66
[母雞] 當初嗑不了愛爽的人算先知嗎?38
[閒聊] 隻狼為什麼那麼難37
[母雞] 哭團戲碼值得那麼多篇幅嗎?☺34
Re: [25冬] Ave Mujica 07 心得33
[母雞] 愛燈、愛爽、愛希算是被祥子NTR嗎?32
[蔚藍] 為了看檔案廣告牆特地從鹿兒島過來結果28
[母雞] 可是C團到頭來還是要解吧?31
[母雞] mujica 重組的發起點是誰31
Re: [25冬] Ave Mujica 07 心得31
Re: [蔚藍] C105本子 我用了半天你給我看這個29
[母雞] 爽世拍燈是什麼意思?