Re: [討論] 其實Deepseek真的很厲害了

ash9911911 發表於 2025/1/29 下午10:17:17

看板C_Chat標題Re: [討論] 其實Deepseek真的很厲害了作者

ash9911911

(勇者ああああ)時間Jan 29 22:17:17 2025推噓57 推:58 噓:1 →:160

OpenAI：已掌握DeepSeek盜用模型證據

https://www.cna.com.tw/news/aopl/202501290140.aspx

（中央社倫敦29日綜合外電報導）中國新創公司「深度求索」（DeepSeek）引發的疑慮日增。OpenAI今天表示已掌握證據，顯示DeepSeek盜用其模型進行開發；業界也指DeepSeek握有大量輝達H100高階晶片，形同直接挑戰美國出口管制規定。

中國的DeepSeek因標榜低成本也能訓練出強大人工智慧（AI）模型，顛覆AI訓練不能沒有精密昂貴晶片的刻板印象，引發市場強烈震盪。

不過，總部設在美國舊金山（San Francisco）的OpenAI公司向英國「金融時報」（
Financial Times）證實，已掌握疑似DeepSeek利用「蒸餾」（distillation）技術的證據。OpenAI是聊天機器人ChatGPT的開發商。

蒸餾技術可讓開發者利用更大、更強的模型輸出成果，在較小模型獲得更出色的表現，並讓他們在特定任務上以更低廉的成本得到類似結果。

儘管蒸餾是AI業界常見做法，但DeepSeek若利用蒸餾技術來打造自家模型，並與OpenAI競爭，將違反OpenAI服務條款，因此產生疑慮。

OpenAI婉拒進一步說明或提供證據細節。根據該公司的服務條款，用戶不得「複製」任何OpenAI的服務，或是「利用輸出結果，來開發與OpenAI競爭的模型」。

彭博（Bloomberg News）28日引述知情人士說法報導，微軟（Microsoft）和OpenAI正在調查一群與DeepSeek有關聯的人是否以未經授權的方式，不當取得OpenAI技術輸出的資訊。

報導指，微軟維安研究員2024年秋天觀察到有人利用OpenAI應用程式介面（API）輸出大筆數據，他們認為這些人可能與DeepSeek有關。

美國總統川普政府的AI專家塞克斯（David Sacks）也在福斯新聞（Fox News）訪談中提及蒸餾技術，並稱有「大量證據」顯示DeepSeek是仰賴OpenAI模型輸出，以協助開發自家技術，但他也沒有進一步提出證據。

另一方面，美國Scale AI執行長汪滔（Alexandr Wang）日前表示，DeepSeek應握有多達5萬顆輝達（Nvidia）H100晶片，以開發現有模型。美國億萬富豪馬斯克（Elon Musk）也在社群平台X回應相關推文，並加上「顯而易見」的評論，似乎同意這項說法。

由於H100晶片被禁止向中國出口，這形同直接挑戰美國出口管制政策。有分析直指，
DeepSeek繞道囤積大量晶片以規避美國管制，因此其真實開發成本恐怕遠高於宣稱的558萬美元（約新台幣1.83億元），未來也勢必將引發美方加強管制。
（譯者：楊昭彥/核稿：施施）1140129

挖要出大事了嗎是不是有大場面可以看了

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.40.22.228 (臺灣)

※ PTT 網址

→

gcobc1263201/29 22:19哈 OpenAI急了

→

nomorethings01/29 22:20樓下說不給晶片是不是怕輸不起

推

efun7700001/29 22:22「蒸餾」（distillation）跟複製盜用應該還需要證據

→

Kt5100001/29 22:22中國偷技術也不是一次兩次了

→

efun7700001/29 22:23看OpenAI最後抓到什麼東西吧?

推

Eric8576801/29 22:24樓下說急了

→

dandes022701/29 22:25被盜用當然急啊^^

推

fireleo01/29 22:26我覺得等OpenAI調查能挖到什麼結果吧

→

dandes022701/29 22:26也只有中國人會這樣把偷來的東西說成是自己發明的

推

sasmwh56101/29 22:27果然還是要用一堆nv 硬體才算的出來，老黃穩穩的

→

spfy01/29 22:27我樂子人等消息這麼多人急著站隊嗎

→

spfy01/29 22:28今天之前有些看法是實際運算量沒這麼低成本

推

joejoe201/29 22:28這只是要安撫股東因為退訂的太多 closeAI被看破手腳

→

ThreekRoger01/29 22:28看不懂，反正還能用就先用

※ 編輯: ash9911911 (114.40.22.228 臺灣), 01/29/2025 22:30:40

推

a215670001/29 22:31美國版的deepseek要賣50%給美國企業

推

RoastCorn01/29 22:34我最喜歡血流成河了.jpg

→

Fates01/29 22:36笑死 openai就沒盜嗎w

推

hcastray01/29 22:37我是覺得沒必要站隊

推

astinky01/29 22:40當然站隊啊，看棒球也是先從決定要支持哪個棒球隊開始(X

→

hcastray01/29 22:40剛好我看中職現在也沒啥在支持球隊了

→

hcastray01/29 22:41從球隊迷轉成球員迷輕鬆自在

→

henry123456201/29 22:44這個只是安撫股東沒錯實際上沒屁用

→

h7531141801/29 22:44抄來便宜用在大外宣

→

henry123456201/29 22:44因為 deepseek真正打擊到openai的是他們的論文

→

henry123456201/29 22:44跟他們已經開源可以對照論文的研究成果

→

henry123456201/29 22:44deepseek本身已經是用完的東西擺著給你用而已

推

outlook201/29 22:46deepseek = 開源版open ai ?

→

outlook201/29 22:46這殺傷力...

→

henry123456201/29 22:46不等於差很多

→

henry123456201/29 22:47deepseek做的事情是用小的模型在特定的領域

→

henry123456201/29 22:47做到能跟openai的o1接近能力而已

→

henry123456201/29 22:47優點就是他模型小所以他訓練起來便宜算力需求低

→

henry123456201/29 22:48缺點就是他是特定領域用的超出領域一概不會

→

henry123456201/29 22:48可以說從理念上就跟chatgpt是完全不同方向的產物

→

henry123456201/29 22:48你要說他抄襲怕是一點基礎都沒有

推

outlook201/29 22:49openai會被嫌太浪費資源? 開發太浪費錢? AI會跳水大

→

outlook201/29 22:49降價?

→

outlook201/29 22:50感謝樓樓上的分析

→

henry123456201/29 22:51結論來說大概會是這樣所以實際損失的都是openai

→

henry123456201/29 22:52對於其他普羅大眾跟其他AI開發者都是好事

→

henry123456201/29 22:53他們有附論文 deepseek其實只是他們的研究報告

推

RandyOrlando01/29 22:53大概只有沒什麼常識的覺得openai還可以靠吉人這招

→

RandyOrlando01/29 22:53挽回劣勢吧

→

henry123456201/29 22:54吉人最多只能讓openai回收一點錢沒有其他用

→

AirPenguin01/29 22:54OpenAI(青春版)

→

henry123456201/29 22:54因為這一刀傷害是永久性的事實被戳穿了

→

henry123456201/29 22:55實際上deepseek這個路線更符合商業用途

→

RandyOrlando01/29 22:55openai本來是放消息說他們2030之前想要花2000億美

→

RandyOrlando01/29 22:55元開發ai

推

vsepr5501/29 22:55做賊的喊抓賊==

推

qazw22201/29 22:55不會被打死但要被大砍一刀

→

RandyOrlando01/29 22:55這個意思就是告訴投資人你要投資我到這些金額

推

XFarter01/29 22:55其實不太有「超出領域一概不會」這件事ㄅ非distilled 版

→

XFarter01/29 22:56本的參數其實也不小了

→

astinky01/29 22:56現在的爭議是宣稱的開發成本造假嗎？

→

henry123456201/29 22:56嘛你可以說超出領域約等於沒特別訓練過

→

RandyOrlando01/29 22:56現在ds出來基本代表這個投資計畫不會再有2000億美

→

RandyOrlando01/29 22:56元的可能性了

→

henry123456201/29 22:56一概不會就誇飾這樣他就唬爛你而已

→

henry123456201/29 22:57畢竟本身還是那個聊天機器人沒訓練下就那樣

→

XFarter01/29 22:57說是研究報告不如說是火力展示更為貼切ㄅ他們還是有在 A

→

XFarter01/29 22:57PI 上面做收費的

→

XFarter01/29 22:57不過那個價格真的是甜了很多比起openAI 更像是在推全世

→

XFarter01/29 22:57界的 AI 福祉==

推

lain200201/29 22:58急了

→

XFarter01/29 22:58我的意思是「超出領域就不會」可以適用於所有 LLM，不是

→

XFarter01/29 22:58只有 DS 才有這個特徵，抱歉沒說清楚

→

henry123456201/29 22:59以下是我聽我哥說的信不信自己判斷

→

henry123456201/29 23:00據說這家本職就不是做AI的他們是靠金融買賣賺錢的

→

henry123456201/29 23:00它們原本就是訓練買賣股票的AI 然後靠買賣股票賺錢

→

henry123456201/29 23:00然後這次他們買了太多為了訓練這AI的算力

→

henry123456201/29 23:01所以多出來的就丟給技術部做研究反正擺著也是浪費

推

kaj198301/29 23:01openai也不會多傷吧，這行業仍然是大者恆大

→

henry123456201/29 23:01這個deepseek就是它們研究成果這樣

→

nomorethings01/29 23:01全世界AI福祉？

→

spfy01/29 23:01是不是越來越奇怪了變成多買的算力順便研究??

→

henry123456201/29 23:01所以那550萬美元本身就是他們多買的算力而已

→

henry123456201/29 23:02然後開源也是因為這就技術研究不是主產品隨便你用

→

spfy01/29 23:02那個天才工程師和天才創辦人也是順便的?

推

fenix22001/29 23:02畢竟是支

推

RandyOrlando01/29 23:03本來就是福祉阿本來要宣稱要花幾千億美元才能推動

→

RandyOrlando01/29 23:03 現在有只花1%一下金額的能做到了能投入資金的門

→

RandyOrlando01/29 23:03檻低那麼多就會有更多人來做

→

henry123456201/29 23:03噱頭吧反正炒一炒無傷大雅阿

→

henry123456201/29 23:03他們收的錢就只是算力不想給你免費用而已

→

henry123456201/29 23:03畢竟你直接用是用他們的算力阿收你基本費不過分吧

→

henry123456201/29 23:03你拿開源模型回去自己用他才不管你了

→

henry123456201/29 23:04你就說這是不是才是真正"OPENAI" 該有的樣子

→

henry123456201/29 23:04論文給了模型給了你想試用也給你用了還想怎樣

推

RandyOrlando01/29 23:07對某些人來說可以便宜推動世界進步的技術不重要出

→

RandyOrlando01/29 23:07產國家是哪個比較重要的概念

推

Richun01/29 23:07原本OpenAI可以閉源只給人接API，就算meta丟出LLaMA也是遠

推

balabala5601/29 23:08老黃大勝利

→

Richun01/29 23:08不及OpenAI的效果，靠著接API穩定賺的錢忽然被deepseek開

推

Lhmstu01/29 23:09openai先說拿了哪些東西訓練，我們再來講“偷”這件事

→

Richun01/29 23:09源砍了一大刀，原本宣稱需要的巨額投資被戳一下就洩氣了。

→

astinky01/29 23:09當然是連算力都免費給人用啊，鄉民當然什麼都想要免費

→

Lhmstu01/29 23:09偷網路上的東西訓練模型來賺錢，還閉源...

推

fenix22001/29 23:11世界進步呵呵

推

dandes022701/29 23:12中國人的反駁怎麼都一樣啊人家問你有沒有打老婆你

→

dandes022701/29 23:12就反問對方沒打老婆嗎

推

sinnerck101/29 23:12DS開源才是對openAI打擊最大的

→

fenix22001/29 23:12證明真的小粉紅還是比數位小粉紅好用

推

RandyOrlando01/29 23:13討論這種議題還想在那邊跳4-11吼也只能說就這樣了

→

RandyOrlando01/29 23:13啦呵呵

→

henry123456201/29 23:13八卦有人講得更清楚點 deepseek重點是方法論不同

→

henry123456201/29 23:14所以實際上你拿任何模型都能用那方法論提升訓練校率

→

henry123456201/29 23:15openAI之所以閉源是為了藏他們提升效能的指導方式

→

henry123456201/29 23:15deepseek的路線就不需要指導方式了所以不同

→

terry95504801/29 23:16黑市什麼都買得到，管制就是笑話

→

astinky01/29 23:16但是ds提升的只有減低成本，要品質還是出不來的樣子？

→

Lhmstu01/29 23:16這樣就中國人了喔，可悲政治腦...

→

henry123456201/29 23:18品質就論文說的在特定領域確實能訓練到跟o1一樣強

→

henry123456201/29 23:18而且某方面來說前後文對照還更強一點

→

AirPenguin01/29 23:18撿網路上資料訓練跟拿人家訓練好的資料是兩碼子事吧

→

henry123456201/29 23:18然後在AI領域降低成本不太是"只有" 的問題

→

henry123456201/29 23:20老實說我懶得對會相信deepseek拿訓練好資料的人解釋

→

henry123456201/29 23:20論文都在那了拿別人資料是有啥用處

→

AirPenguin01/29 23:21沒人在跟你講話啦要回那麼大一串怎麼不乾脆回一篇

→

henry123456201/29 23:22沒欠你啊幹嘛要浪費我時間發一篇

→

Hakase556601/29 23:22OpenAI都沒開源是要怎麼抄襲？

→

Hakase556601/29 23:24台灣真神奇沒開源的東西一堆人相信有被偷然後公開

→

Hakase556601/29 23:24的論文被抄襲反而卻有不少人護航

推

fireleo01/29 23:24老實說號稱低成本就能跟GPT一樣算力這個就有很大的疑問

→

fireleo01/29 23:24了

推

neige92301/29 23:25稀土一帶一路5G華為晶片...支那謊言破產速度愈來愈快，

→

henry123456201/29 23:25他論文有寫用什麼比跟什麼模型比評分個是多少

→

neige92301/29 23:25現在才兩日就開始跑破解流程了

→

henry123456201/29 23:25所以不信可以自己去試試看

→

AirPenguin01/29 23:26在這下面回了快一個小時時間還真寶貴啊

→

henry123456201/29 23:26回推文跟回文要的時間差距難道要我教你?

→

kaj198301/29 23:26你們在這吵好像也沒有辦法驗證誰對誰錯啊

推

cactus4401/29 23:26都開源免費使用,真有抄襲證據應該很好抓吧,而且一

→

cactus4401/29 23:26堆研究者查不出也難莫名的

→

henry123456201/29 23:27我個人認為至少效能這部分如果是假的早就被公開了

→

kaj198301/29 23:27真的有抄襲早就一刀斃命了

→

henry123456201/29 23:28這麼多人去試評分是假的應該不難測出來吧

→

henry123456201/29 23:28至於成本這只能說就你信不信囉方法論寫在論文

→

henry123456201/29 23:29等別人試論文的方法論能不能複現吧

→

astinky01/29 23:31如果以陰謀論來猜想，假設復現需要相當的時間及成本，等

→

astinky01/29 23:31證明為假之時是否有炒作股票套利的空間可能？

→

AirPenguin01/29 23:33想吵是建議去股版啦推文這串在股版都講到爛了

→

henry123456201/29 23:34我不能說沒有但我是覺得為了搞這套也太大手筆

→

astinky01/29 23:37看新聞講市值蒸發多少多少，好像為此而大手筆也不為過？

推

webberfun01/29 23:46畢竟是支那

推

XFarter01/29 23:47都幾乎全開源給你看了論文也有跟裸奔沒兩樣其實光這樣

→

XFarter01/29 23:47質疑的聲音就小很多也是為什麼全世界整個炸開的原因==

→

XFarter01/29 23:47一些相對沒根據的質疑是真的大可不必

→

XFarter01/29 23:48效能要是假的也太難 livebench 這種第三方測試的都表示真

→

XFarter01/29 23:48的強如鬼神了

→

xga00mex01/29 23:52抄襲看笑話沒抄爽用開源模型都好

推

RandyOrlando01/29 23:52主打的就是一個我不了解但是我硬要嘴的概念嘛習慣

→

RandyOrlando01/29 23:52就好

推

qazzqaz01/29 23:58抱歉好奇伸手問個，

→

qazzqaz01/29 23:58DeepSeek是開源到連model都能自己載來玩嗎？

→

qazzqaz01/29 23:58還是單純把他的方法寫成paper?

→

qazzqaz01/30 00:00喔喔，找到GitHub頁面了，竟然有欸，沒事，你們繼續(x

推

ISAF01/30 00:02謝謝中國膠的表演

→

henry123456201/30 00:10答案是都有XDD

推

aa901201/30 00:14Deepseek免錢我站DS

推

tim86062801/30 00:18我只關心什麼時候會有基於Deepaeek的瑟瑟模型

→

inte629l01/30 00:21原來可以藉由API的output去微調其他模型? cool

推

qazzqaz01/30 00:24挖乾，看了一下，他好幾個模型的license都沒有擋商用，

→

qazzqaz01/30 00:24不確定是不是正常(我對open source規則不熟)

→

qazzqaz01/30 00:24這樣子感覺未來的潛力很可怕耶，市場真的要亂掉了ww

推

ZeroArcher01/30 00:25AirPenguin看起來好急喔

→

qazzqaz01/30 00:25希望不是像Mamba那樣曇花一現

→

spfy01/30 00:28我也覺得蓋大樓不如回一篇這很正常

→

qazzqaz01/30 00:28順帶一提，有看到不給軍事用途，但真的用了哪抓得到w

→

spfy01/30 00:28喊很急不如多回點內容

推

qtsin01/30 00:29都是到處爬了一堆沒授權，旁邊看戲就好

→

henry123456201/30 00:29都開源了就是給大家研究他們自己會不會研究不知道

→

henry123456201/30 00:30我不想回文兩個原因 1.費時沒欠你 2.我也不是專業

→

henry123456201/30 00:31基本上全是自己理解你自己去查不會差到哪去

→

henry123456201/30 00:31除了我哥說的那段公司拿剩餘算力來做的可能查不到外

→

henry123456201/30 00:31其他的怕是你自己查可能更正確

→

spfy01/30 00:32我說我覺得他說的對不是要你回文你沒欠我沒錯

→

henry123456201/30 00:33所以我覺得整理我說的話沒意義這樣

推

qazzqaz01/30 00:34但如果那個說法屬實，他開源出去反而會影響到本業吧

→

qazzqaz01/30 00:34拿來弄股票的人一多，本來的模型就不準了

→

qazzqaz01/30 00:35等於是拿石頭砸自己的腳，除非他覺得改靠賣API賺更多

推

Peurintesa01/30 00:35有技術報告也有Github啊 openai告了頂多跟DS討錢

→

Peurintesa01/30 00:36但東西都開源了技術散播出去也收不回來了

→

henry123456201/30 00:37可能性很多例如他的模型也有考慮過這個了

推

ilove64001/30 00:37急了

推

Richun01/30 00:37他開源出去又不會污染到原本的資料集，可以當成分叉就好。

→

henry123456201/30 00:37或是他們蠢沒想到這層或是我哥胡說我也跟著胡說

→

Richun01/30 00:38因為不是本業，所以可以靠低價入市+開源打廣告。

推

vios1000901/30 00:38這種東西開源就跟把辟邪劍譜印了10萬份

→

vios1000901/30 00:38散播到整個江湖去一樣

→

henry123456201/30 00:39最有價值的確實就是論文沒錯

→

henry123456201/30 00:39開源就是論文附的示範品這樣

推

cactus4401/30 00:40已經開始有企業導入DS來用了,免錢這點優勢真的很大

→

henry123456201/30 00:43至少個人認為這對AI發展是好事啦

推

Peurintesa01/30 00:43還在著重套模的我覺得太小看DS了他是有說明怎麼做的

→

henry123456201/30 00:43不管是應用面還是開發面都會成長不少

推

inmatao01/30 00:59遙想手雕晶片

噓

defreestijl01/30 01:04OpenAI自己都不敢公布訓練用到哪些source了

→

defreestijl01/30 01:04只會說一切來源合法合規

推

shortoneal01/30 01:57笑死，不能幹openAI輸出的結果訓練，阿你訓練GPT的

→

shortoneal01/30 01:57data哪來的，請一堆科學家幫你寫的逆

→

shortoneal01/30 01:58這領域我是不知道誰有臉跳出來喊人侵權啦

→

shortoneal01/30 02:00但是github是微軟主場，會不會出陰招強迫閉源呢?

→

qwer33885901/30 02:18GitHub只是一個倉庫被擋用別家不就好了

推

willy490701/30 03:09急了證明DS殺傷力很大

推

urzakim01/30 07:08我有證據但是我不跟你說名嘴嗎？

推

skullxism01/30 07:12要有證據才能說人家打老婆吧，Excel打老婆嗎

推

blessbless01/30 08:09這不就沒證據出來安撫股民的，真的告了再來談好嗎

推

DICKASDF01/30 08:11我覺得這看下去就知道但台灣很奇怪的是

→

DICKASDF01/30 08:11一堆人急著跳出來批評出發點是因為那是中國做的

→

kasim1501/30 08:15股民請保持信心XDD

推

tcl121901/30 08:19OpenAI還沒上市吧

→

jay92031401/30 08:50人家開源高大上

推

Diver12301/30 08:51我有證據但我不能公布，好怪

推

henshin01/30 09:27逢中必反蟾蜍又來了

→

suanruei01/30 09:56那你close ai 怎麼拿不出同樣的成果

推

fenix22001/30 10:15逢支必舔人啟動

→

Ceferino01/30 10:46openai的推理模型又沒開源怎麼distillation，買訂閱一

→

Ceferino01/30 10:46直瘋狂問嗎ww

同系列文章

[討論] 其實Deepseek真的很厲害了

其他人也閱讀了

PTT 熱門相關