PTT推薦

Re: [討論] 其實Deepseek真的很厲害了

看板C_Chat標題Re: [討論] 其實Deepseek真的很厲害了作者
ash9911911
(勇者ああああ)
時間推噓57 推:58 噓:1 →:160

OpenAI:已掌握DeepSeek盜用模型證據

https://www.cna.com.tw/news/aopl/202501290140.aspx

(中央社倫敦29日綜合外電報導)中國新創公司「深度求索」(DeepSeek)引發的疑慮日增。OpenAI今天表示已掌握證據,顯示DeepSeek盜用其模型進行開發;業界也指DeepSeek握有大量輝達H100高階晶片,形同直接挑戰美國出口管制規定。

中國的DeepSeek因標榜低成本也能訓練出強大人工智慧(AI)模型,顛覆AI訓練不能沒有精密昂貴晶片的刻板印象,引發市場強烈震盪。

不過,總部設在美國舊金山(San Francisco)的OpenAI公司向英國「金融時報」(
Financial Times)證實,已掌握疑似DeepSeek利用「蒸餾」(distillation)技術的證據。OpenAI是聊天機器人ChatGPT的開發商。

蒸餾技術可讓開發者利用更大、更強的模型輸出成果,在較小模型獲得更出色的表現,並讓他們在特定任務上以更低廉的成本得到類似結果。

儘管蒸餾是AI業界常見做法,但DeepSeek若利用蒸餾技術來打造自家模型,並與OpenAI競爭,將違反OpenAI服務條款,因此產生疑慮。

OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款,用戶不得「複製」任何OpenAI的服務,或是「利用輸出結果,來開發與OpenAI競爭的模型」。

彭博(Bloomberg News)28日引述知情人士說法報導,微軟(Microsoft)和OpenAI正在調查一群與DeepSeek有關聯的人是否以未經授權的方式,不當取得OpenAI技術輸出的資訊。

報導指,微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面(API)輸出大筆數據,他們認為這些人可能與DeepSeek有關。

美國總統川普政府的AI專家塞克斯(David Sacks)也在福斯新聞(Fox News)訪談中提及蒸餾技術,並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出,以協助開發自家技術,但他也沒有進一步提出證據。


另一方面,美國Scale AI執行長汪滔(Alexandr Wang)日前表示,DeepSeek應握有多達5萬顆輝達(Nvidia)H100晶片,以開發現有模型。美國億萬富豪馬斯克(Elon Musk)也在社群平台X回應相關推文,並加上「顯而易見」的評論,似乎同意這項說法。

由於H100晶片被禁止向中國出口,這形同直接挑戰美國出口管制政策。有分析直指,
DeepSeek繞道囤積大量晶片以規避美國管制,因此其真實開發成本恐怕遠高於宣稱的558萬美元(約新台幣1.83億元),未來也勢必將引發美方加強管制。
(譯者:楊昭彥/核稿:施施)1140129


挖要出大事了嗎 是不是有大場面可以看了

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.40.22.228 (臺灣)
PTT 網址

gcobc1263201/29 22:19哈 OpenAI急了

nomorethings01/29 22:20樓下說不給晶片是不是怕輸不起

efun7700001/29 22:22「蒸餾」(distillation) 跟複製盜用應該還需要證據

Kt5100001/29 22:22中國偷技術也不是一次兩次了

efun7700001/29 22:23看OpenAI最後抓到什麼東西吧?

Eric8576801/29 22:24樓下說急了

dandes022701/29 22:25被盜用當然急啊^^

fireleo01/29 22:26我覺得等OpenAI調查能挖到什麼結果吧

dandes022701/29 22:26也只有中國人會這樣把偷來的東西說成是自己發明的

sasmwh56101/29 22:27果然還是要用一堆nv 硬體才算的出來,老黃穩穩的

spfy01/29 22:27我樂子人等消息 這麼多人急著站隊嗎

spfy01/29 22:28今天之前 有些看法是實際運算量沒這麼低成本

joejoe201/29 22:28這只是要安撫股東 因為退訂的太多 closeAI被看破手腳

ThreekRoger01/29 22:28看不懂,反正還能用就先用

※ 編輯: ash9911911 (114.40.22.228 臺灣), 01/29/2025 22:30:40

a215670001/29 22:31美國版的deepseek要賣50%給美國企業

RoastCorn01/29 22:34我最喜歡血流成河了.jpg

Fates01/29 22:36笑死 openai就沒盜嗎w

hcastray01/29 22:37我是覺得沒必要站隊

astinky01/29 22:40當然站隊啊,看棒球也是先從決定要支持哪個棒球隊開始(X

hcastray01/29 22:40剛好我看中職現在也沒啥在支持球隊了

hcastray01/29 22:41從球隊迷轉成球員迷輕鬆自在

henry123456201/29 22:44這個只是安撫股東沒錯 實際上沒屁用

h7531141801/29 22:44抄來便宜用在大外宣

henry123456201/29 22:44因為 deepseek真正打擊到openai的是他們的論文

henry123456201/29 22:44跟他們已經開源可以對照論文的研究成果

henry123456201/29 22:44deepseek本身已經是用完的東西 擺著給你用而已

outlook201/29 22:46deepseek = 開源版open ai ?

outlook201/29 22:46這殺傷力...

henry123456201/29 22:46不等於 差很多

henry123456201/29 22:47deepseek做的事情 是用小的模型 在特定的領域

henry123456201/29 22:47做到能跟openai的o1接近能力而已

henry123456201/29 22:47優點就是他模型小 所以他訓練起來便宜 算力需求低

henry123456201/29 22:48缺點就是 他是特定領域用的 超出領域一概不會

henry123456201/29 22:48可以說從理念上就跟chatgpt是完全不同方向的產物

henry123456201/29 22:48你要說他抄襲怕是一點基礎都沒有

outlook201/29 22:49openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大

outlook201/29 22:49降價?

outlook201/29 22:50感謝樓樓上的分析

henry123456201/29 22:51結論來說 大概會是這樣 所以實際損失的都是openai

henry123456201/29 22:52對於其他普羅大眾 跟其他AI開發者 都是好事

henry123456201/29 22:53他們有附論文 deepseek其實只是他們的研究報告

RandyOrlando01/29 22:53大概只有沒什麼常識的覺得openai還可以靠吉人這招

RandyOrlando01/29 22:53挽回劣勢吧

henry123456201/29 22:54吉人最多只能讓openai回收一點錢 沒有其他用

AirPenguin01/29 22:54OpenAI(青春版)

henry123456201/29 22:54因為這一刀傷害是永久性的 事實被戳穿了

henry123456201/29 22:55實際上deepseek這個路線更符合商業用途

RandyOrlando01/29 22:55openai本來是放消息說他們2030之前想要花2000億美

RandyOrlando01/29 22:55元開發ai

vsepr5501/29 22:55做賊的喊抓賊==

qazw22201/29 22:55不會被打死但要被大砍一刀

RandyOrlando01/29 22:55這個意思就是告訴投資人你要投資我到這些金額

XFarter01/29 22:55其實不太有「超出領域一概不會」這件事ㄅ 非distilled 版

XFarter01/29 22:56本的參數其實也不小了

astinky01/29 22:56現在的爭議是宣稱的開發成本造假嗎?

henry123456201/29 22:56嘛 你可以說 超出領域 約等於沒特別訓練過

RandyOrlando01/29 22:56現在ds出來基本代表這個投資計畫不會再有2000億美

RandyOrlando01/29 22:56元的可能性了

henry123456201/29 22:56一概不會就誇飾 這樣 他就唬爛你而已

henry123456201/29 22:57畢竟本身還是那個聊天機器人 沒訓練下就那樣

XFarter01/29 22:57說是研究報告不如說是火力展示更為貼切ㄅ 他們還是有在 A

XFarter01/29 22:57PI 上面做收費的

XFarter01/29 22:57不過那個價格真的是甜了很多 比起openAI 更像是在推全世

XFarter01/29 22:57界的 AI 福祉==

lain200201/29 22:58急了

XFarter01/29 22:58我的意思是「超出領域就不會」可以適用於所有 LLM,不是

XFarter01/29 22:58只有 DS 才有這個特徵,抱歉沒說清楚

henry123456201/29 22:59以下是我聽我哥說的 信不信自己判斷

henry123456201/29 23:00據說這家本職就不是做AI的 他們是靠金融買賣賺錢的

henry123456201/29 23:00它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢

henry123456201/29 23:00然後這次他們買了太多為了訓練這AI的算力

henry123456201/29 23:01所以多出來的就丟給技術部做研究 反正擺著也是浪費

kaj198301/29 23:01openai也不會多傷吧,這行業仍然是大者恆大

henry123456201/29 23:01這個deepseek就是它們研究成果 這樣

nomorethings01/29 23:01全世界AI福祉 ?

spfy01/29 23:01是不是越來越奇怪了 變成多買的算力順便研究??

henry123456201/29 23:01所以那550萬美元本身就是他們多買的算力而已

henry123456201/29 23:02然後開源也是因為這就技術研究 不是主產品 隨便你用

spfy01/29 23:02那個天才工程師和天才創辦人也是順便的?

fenix22001/29 23:02畢竟是支

RandyOrlando01/29 23:03本來就是福祉阿 本來要宣稱要花幾千億美元才能推動

RandyOrlando01/29 23:03 現在有只花1%一下金額的能做到了 能投入資金的門

RandyOrlando01/29 23:03檻低那麼多就會有更多人來做

henry123456201/29 23:03噱頭吧 反正炒一炒無傷大雅阿

henry123456201/29 23:03他們收的錢就只是算力不想給你免費用而已

henry123456201/29 23:03畢竟你直接用是用他們的算力阿 收你基本費不過分吧

henry123456201/29 23:03你拿開源模型回去自己用他才不管你了

henry123456201/29 23:04你就說 這是不是才是真正"OPENAI" 該有的樣子

henry123456201/29 23:04論文給了 模型給了 你想試用也給你用了 還想怎樣

RandyOrlando01/29 23:07對某些人來說可以便宜推動世界進步的技術不重要 出

RandyOrlando01/29 23:07產國家是哪個比較重要的概念

Richun01/29 23:07原本OpenAI可以閉源只給人接API,就算meta丟出LLaMA也是遠

balabala5601/29 23:08老黃大勝利

Richun01/29 23:08不及OpenAI的效果,靠著接API穩定賺的錢忽然被deepseek開

Lhmstu01/29 23:09openai先說拿了哪些東西訓練,我們再來講“偷”這件事

Richun01/29 23:09源砍了一大刀,原本宣稱需要的巨額投資被戳一下就洩氣了。

astinky01/29 23:09當然是連算力都免費給人用啊,鄉民當然什麼都想要免費

Lhmstu01/29 23:09偷網路上的東西訓練模型來賺錢,還閉源...

fenix22001/29 23:11世界進步呵呵

dandes022701/29 23:12中國人的反駁怎麼都一樣啊 人家問你有沒有打老婆 你

dandes022701/29 23:12就反問對方沒打老婆嗎

sinnerck101/29 23:12DS開源才是對openAI打擊最大的

fenix22001/29 23:12證明真的小粉紅還是比數位小粉紅好用

RandyOrlando01/29 23:13討論這種議題還想在那邊跳4-11吼也只能說就這樣了

RandyOrlando01/29 23:13啦 呵呵

henry123456201/29 23:13八卦有人講得更清楚點 deepseek重點是方法論不同

henry123456201/29 23:14所以實際上你拿任何模型都能用那方法論提升訓練校率

henry123456201/29 23:15openAI之所以閉源 是為了藏他們提升效能的指導方式

henry123456201/29 23:15deepseek的路線就不需要指導方式了 所以不同

terry95504801/29 23:16黑市什麼都買得到,管制就是笑話

astinky01/29 23:16但是ds提升的只有減低成本,要品質還是出不來的樣子?

Lhmstu01/29 23:16這樣就中國人了喔,可悲政治腦...

henry123456201/29 23:18品質就論文說的 在特定領域確實能訓練到跟o1一樣強

henry123456201/29 23:18而且某方面來說前後文對照還更強一點

AirPenguin01/29 23:18撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧

henry123456201/29 23:18然後 在AI領域 降低成本不太是"只有" 的問題

henry123456201/29 23:20老實說我懶得對會相信deepseek拿訓練好資料的人解釋

henry123456201/29 23:20論文都在那了 拿別人資料是有啥用處

AirPenguin01/29 23:21沒人在跟你講話啦 要回那麼大一串怎麼不乾脆回一篇

henry123456201/29 23:22沒欠你啊 幹嘛要浪費我時間發一篇

Hakase556601/29 23:22OpenAI都沒開源是要怎麼抄襲?

Hakase556601/29 23:24台灣真神奇 沒開源的東西一堆人相信有被偷 然後公開

Hakase556601/29 23:24的論文被抄襲反而卻有不少人護航

fireleo01/29 23:24老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問

fireleo01/29 23:24

neige92301/29 23:25稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快,

henry123456201/29 23:25他論文有寫用什麼比 跟什麼模型比 評分個是多少

neige92301/29 23:25現在才兩日就開始跑破解流程了

henry123456201/29 23:25所以不信可以自己去試試看

AirPenguin01/29 23:26在這下面回了快一個小時 時間還真寶貴啊

henry123456201/29 23:26回推文跟回文要的時間差距難道要我教你?

kaj198301/29 23:26你們在這吵好像也沒有辦法驗證誰對誰錯啊

cactus4401/29 23:26都開源免費使用,真有抄襲證據應該很好抓吧,而且一

cactus4401/29 23:26堆研究者查不出也難莫名的

henry123456201/29 23:27我個人認為 至少效能這部分如果是假的早就被公開了

kaj198301/29 23:27真的有抄襲早就一刀斃命了

henry123456201/29 23:28這麼多人去試 評分是假的應該不難測出來吧

henry123456201/29 23:28至於成本 這只能說就你信不信囉 方法論寫在論文

henry123456201/29 23:29等別人試論文的方法論能不能複現吧

astinky01/29 23:31如果以陰謀論來猜想,假設復現需要相當的時間及成本,等

astinky01/29 23:31證明為假之時是否有炒作股票套利的空間可能?

AirPenguin01/29 23:33想吵是建議去股版啦 推文這串在股版都講到爛了

henry123456201/29 23:34我不能說沒有 但我是覺得為了搞這套也太大手筆

astinky01/29 23:37看新聞講市值蒸發多少多少,好像為此而大手筆也不為過?

webberfun01/29 23:46畢竟是支那

XFarter01/29 23:47都幾乎全開源給你看了 論文也有 跟裸奔沒兩樣 其實光這樣

XFarter01/29 23:47質疑的聲音就小很多 也是為什麼全世界整個炸開的原因==

XFarter01/29 23:47一些相對沒根據的質疑是真的大可不必

XFarter01/29 23:48效能要是假的也太難 livebench 這種第三方測試的都表示真

XFarter01/29 23:48的強如鬼神了

xga00mex01/29 23:52抄襲看笑話 沒抄爽用開源模型 都好

RandyOrlando01/29 23:52主打的就是一個我不了解但是我硬要嘴的概念嘛 習慣

RandyOrlando01/29 23:52就好

qazzqaz01/29 23:58抱歉好奇伸手問個,

qazzqaz01/29 23:58DeepSeek是開源到連model都能自己載來玩嗎?

qazzqaz01/29 23:58還是單純把他的方法寫成paper?

qazzqaz01/30 00:00喔喔,找到GitHub頁面了,竟然有欸,沒事,你們繼續(x

ISAF01/30 00:02謝謝中國膠的表演

henry123456201/30 00:10答案是 都有XDD

aa901201/30 00:14Deepseek免錢 我站DS

tim86062801/30 00:18我只關心什麼時候會有基於Deepaeek的瑟瑟模型

inte629l01/30 00:21原來可以藉由API的output去微調其他模型? cool

qazzqaz01/30 00:24挖乾,看了一下,他好幾個模型的license都沒有擋商用,

qazzqaz01/30 00:24不確定是不是正常(我對open source規則不熟)

qazzqaz01/30 00:24這樣子感覺未來的潛力很可怕耶,市場真的要亂掉了ww

ZeroArcher01/30 00:25AirPenguin看起來好急喔

qazzqaz01/30 00:25希望不是像Mamba那樣曇花一現

spfy01/30 00:28我也覺得蓋大樓不如回一篇 這很正常

qazzqaz01/30 00:28順帶一提,有看到不給軍事用途,但真的用了哪抓得到w

spfy01/30 00:28喊很急不如多回點內容

qtsin01/30 00:29都是到處爬了一堆沒授權,旁邊看戲就好

henry123456201/30 00:29都開源了 就是給大家研究 他們自己會不會研究不知道

henry123456201/30 00:30我不想回文兩個原因 1.費時 沒欠你 2.我也不是專業

henry123456201/30 00:31基本上全是自己理解 你自己去查不會差到哪去

henry123456201/30 00:31除了我哥說的那段公司拿剩餘算力來做的可能查不到外

henry123456201/30 00:31其他的怕是你自己查可能更正確

spfy01/30 00:32我說我覺得他說的對 不是要你回文 你沒欠我沒錯

henry123456201/30 00:33所以我覺得整理我說的話沒意義 這樣

qazzqaz01/30 00:34但如果那個說法屬實,他開源出去反而會影響到本業吧

qazzqaz01/30 00:34拿來弄股票的人一多,本來的模型就不準了

qazzqaz01/30 00:35等於是拿石頭砸自己的腳,除非他覺得改靠賣API賺更多

Peurintesa01/30 00:35有技術報告也有Github啊 openai告了頂多跟DS討錢

Peurintesa01/30 00:36但東西都開源了 技術散播出去也收不回來了

henry123456201/30 00:37可能性很多 例如他的模型也有考慮過這個了

ilove64001/30 00:37急了

Richun01/30 00:37他開源出去又不會污染到原本的資料集,可以當成分叉就好。

henry123456201/30 00:37或是他們蠢沒想到這層 或是 我哥胡說我也跟著胡說

Richun01/30 00:38因為不是本業,所以可以靠低價入市+開源打廣告。

vios1000901/30 00:38這種東西開源就跟把辟邪劍譜印了10萬份

vios1000901/30 00:38散播到整個江湖去一樣

henry123456201/30 00:39最有價值的確實就是論文沒錯

henry123456201/30 00:39開源就是論文附的示範品這樣

cactus4401/30 00:40已經開始有企業導入DS來用了,免錢這點優勢真的很大

henry123456201/30 00:43至少個人認為這對AI發展是好事啦

Peurintesa01/30 00:43還在著重套模的我覺得太小看DS了 他是有說明怎麼做的

henry123456201/30 00:43不管是應用面還是開發面 都會成長不少

inmatao01/30 00:59遙想手雕晶片

defreestijl01/30 01:04OpenAI自己都不敢公布訓練用到哪些source了

defreestijl01/30 01:04只會說一切來源合法合規

shortoneal01/30 01:57笑死,不能幹openAI輸出的結果訓練,阿你訓練GPT的

shortoneal01/30 01:57data哪來的,請一堆科學家幫你寫的逆

shortoneal01/30 01:58這領域我是不知道誰有臉跳出來喊人侵權啦

shortoneal01/30 02:00但是github是微軟主場,會不會出陰招強迫閉源呢?

qwer33885901/30 02:18GitHub只是一個倉庫 被擋用別家不就好了

willy490701/30 03:09急了 證明DS殺傷力很大

urzakim01/30 07:08我有證據 但是我不跟你說 名嘴嗎?

skullxism01/30 07:12要有證據才能說人家打老婆吧,Excel打老婆嗎

blessbless01/30 08:09這不就沒證據出來安撫股民的,真的告了再來談好嗎

DICKASDF01/30 08:11我覺得這看下去就知道 但台灣很奇怪的是

DICKASDF01/30 08:11一堆人急著跳出來批評 出發點是因為那是中國做的

kasim1501/30 08:15股民請保持信心XDD

tcl121901/30 08:19OpenAI還沒上市吧

jay92031401/30 08:50人家開源 高大上

Diver12301/30 08:51我有證據但我不能公布,好怪

henshin01/30 09:27逢中必反蟾蜍又來了

suanruei01/30 09:56那你close ai 怎麼拿不出同樣的成果

fenix22001/30 10:15逢支必舔人 啟動

Ceferino01/30 10:46openai的推理模型又沒開源怎麼distillation,買訂閱一

Ceferino01/30 10:46直瘋狂問嗎ww