Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

zzahoward 發表於 2025/1/30 上午7:26:03

看板Stock標題Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據作者

zzahoward

(Cheshire Cat)時間Jan 30 07:26:03 2025推噓爆推:128 噓:10 →:173

PTT推薦

以下部分資訊來自於Reddit anitakirkovska文章的翻譯

LDPC哥哥講到一個重點

Reinforcement Learning =/= Reinforcement Learning from Human Feedback

這也是R1為什麼爆紅的原因

https://imgur.com/lunsvb2.jpg

GPT-4最強的地方是他有了某方面的"思考鍊"

(chain-of-thought) 也就是能做出更靈活更準確的推理

但OpenAI是怎麼做出來的並沒有公開，而Deepseek R1是直接公布出來

圖裡面的縮寫全名如下

Cold start data: 最低限度標記的資料集合，讓模型更好理解任務

RL: Reinforcement Learning 模型透過評分獎勵來學習正確答案以及思考邏輯

RLHF = 用人工審查，所以才有當初Google要員工去餵Bard的新聞

SFT: Supervised fine-tuning 用標記的資料去訓練模型讓他在特定領域中更精準

Rejection sampling: 模型產出多個結果的時候選擇特定滿足標準的輸出

其實其他部分都差不多，但Deepseek是用什麼方式去壓低成本去做Pure RL?

用他們自己研發的Gpro (Group Robust Preference Optimization)

https://arxiv.org/abs/2405.20304

他們怎麼不透過人工去確定產出優劣?

邏輯就是建立最佳猜測的模型: Coherence, Completeness, Fluency

但這也帶來另外一個缺點

就是poor readability (閱讀性差)、language mixing(語言混和)

所以Deepseek用第一張圖的方式去解決

Cold start data處理易讀性

用RL+Rejection sampling+SFT反覆驗證計算並Fine tune 結果

但R1背後的意涵，其實是RL能讓小模型在專精領域出頭天

透過Distill然後微調RL內容，可以在專精領域如藥物、材料...等取得更好的成果

而不用再被綁死於大型語言service provider的服務

而這個也帶來一個影響

企業在AI應用上會更有彈性，同時AI實際應用的穿透性更高

https://tinyurl.com/ms2vev4s

R1背後的邏輯和技術，用在小模型上面有極大的成本優勢

大型語言的發展依然會持續，但硬體算力軍備競賽的資本投入勢必會減少

因為大型語言還是適合多數小白使用者 (如我)

以GPT-4來說，他給的回答訊息會很完整包括前因後果

而R1給的就是非常簡潔.....不太廢話

對專業人士來說，R1有時候只給你一行字其實非常的有效率

但智障如我就必須要花更多時間去思考

BTW R1在Ethical Considerations 上面多數人評價是比GPT4還好喔XDDDD

看到這東西，反正是開源的，程式碼都攤開在那邊給你看

應該是要想著怎麼去利用，而不是討論中/美或成最大贏家嗎?

怎麼搞到變成政治意識形態的爭執了?

有些推文一直扯到超導體，我就不懂有什麼可比性...

本身有一點點計算機概論底子加上英文能力就可以去稍微理解這東西

結果很多人都只用台灣媒體或網紅的貼文去判斷，這個邏輯不太行阿

※ 引述《LDPC (Channel Coding)》之銘言：
: 現在全網路上的開源數據資料是屬於pre-training端大多都是野生數據無標籤
: 那東西只是讓模型去向鸚鵡一樣去做文字接龍
: 但第二階段訓練會用到RLHF (Reinforcement Learning from Human Feedback)
: 就是要人類針對不同數據給意見這個是要給標籤
: 所以你才會聽到狗家之前要求全公司員工去給意見讓Gemini前身 Bard 去做人類feedback: 這個人工成本是很大
: Deepseek-R1跟大家說我們不用人類給的feedback了我們可以免除這塊
: 大家都在討論的叫做sythetic dataset
: 這個步驟是來自於你有許多野生數據但需要加上標籤那標籤可以拿更強大模型來標註: 比方說一道數學題目你可以用人類寫解答或者要拆步驟每步驟讓gpt-4o寫個答案
: 這就是所謂synthetic dataset 然後用這組數據去調教模型這步驟會決定
: 你的模型多智能這過程就是call api 現在ai界都這樣幹缺點就是訓練模型上限就是: 原始母模型這跟傳統蒸留用模型直接交模型不太依一樣
: 這種方式就是可以用低成本接近gpt-4o 但你如果這樣幹你模型就不能商業化
: 頂多發表到文章講你這是怎樣做最經典例子就是LLaVA那篇講如何用gpt4o
: 產生sythetic dataset讓textLLM 變成多模態直接打爆其他大廠高成本多模態
: 之前網路上已經有人在討論到底deepseek有沒有用api去合成數據
: https://reurl.cc/A6ab98
: https://x.com/bboczeng/status/1883374489519698413 (zero是r1第一版)
: 在training這部分還沒定案之前大家就先吃瓜看看吧 @@
: 但這思路還是有可取之處就是模型教模型不要再用人類RLHF去教模型
: https://x.com/op7418/status/1884065603184681162
: 這有點像回到當年alphago那條路線模型互相教
: 下面網址是第三方大家要複製deep-seek R1開源計畫任何人想參加都可以
: https://huggingface.co/blog/open-r1
: 目前公認是dep-seek R1隱藏了
: Replicate the R1-Distill models by distilling a high-quality
: reasoning dataset from DeepSeek-R1.
: 上面專案在徵求大家嘗試去製造出合成數據
: 好了我要去炸薯條了 @@/ 救救我
: ※ 引述《IBIZA (溫一壺月光作酒)》之銘言：
: : 各家互相參考, 指的是訓練方法還有訓練的文本挑選, 蒸餾不太一樣
: : AI = 模型的程式碼+訓練
: : 能開源的部分只有程式碼, 訓練是看各自調教
: : 模型的能力夠, 差不多的調教方式就會得到差不多的結果
: : 訓練方法更好, 或是文本品質越高、越多樣、量越多, 模型就越強
: : 自從OpenAI爆紅以來, 大公司的LLM模型都是遵循OpenAI的訓練方法
: : 預先訓練: 拿大量文本讓AI模型學習基本語言能力、基本知識
: : 監督微調: 有了基本能力之後, 模型開始有推理能力
: : 這時候由人類介入, 告訴模型怎麼想是對的, 怎麼想是錯的
: : 之前所謂的貼標籤, 就是這個階段
: : 獎勵建模: 把對錯的判斷建立模型, AI想對了, 這個模型就獎勵他
: : 強化學習: AI自己跟自己練習
: : 不管是meta還是google, 之前都是照OpenAI這個成功模式做
: : 所以這些公司能做的就是拚算力, 透過更大量的訓練, 希望最終可以暴力超車
: : 但蒸餾就不同, 蒸餾是直接拿另一個模型的推理結果, 讓另一個模型照著得到同樣結果: : 譬如我要我剛剛問ChatGPT, 要他給舉例說明什麼是擬人法
: : 他的回答是這樣
: : https://i.imgur.com/ey5mX61.png

: : ChatGPT要回答這個問題, 中間要經過很多推理, 譬如他要先理解我的問題
: : 這裡面就牽涉到, 他要理解我講的擬人法是修辭當中的擬人法
: : 然後再從這一個理解, 去思考擬人法的意思是甚麼, 最後再想出一個符合範例
: : 蒸餾的話, 就是學生模型已經預先知道這個問題的答案是甚麼
: : 有頭有尾, 要生出中間的推理就會比較容易
: : 但這裡有個問題
: : 你要用蒸餾讓一個模型得到另一個模型類似的能力
: : 通常就是需要老師模型產生極大量的練習後結果
: : 才能傳授畢生功力給學生模型
: : 如果ChatGPT是開源模型, 可以自己部署在自己平台上
: : 要做這樣大規模訓練是有可能
: : 但ChatGPT無法部署在自己平台
: : (剛剛有人說ChatGPT 2可以, 但蒸餾頂多只能逼近老師, 用ChatGPT 2只能蒸出垃圾): : 所以要做蒸餾只能透過API, 而要透過API做幾千萬甚至幾億規模的蒸餾訓練
: : 這難度極高啊....
: : (ChatGPT剛剛教我另一個方法
: : 就是拿一個原本就有ChatGPT4能力的模型
: : 這樣只要少量訓練, 就能超越ChatGPT 4
: : 但原本就有ChatGPT 4能力的新模型難道自己會生出來嗎XD
: : 你還是得先得到這個模型啊...就是V3
: : 那V3怎麼來?)

--

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.78.138 (臺灣)

※ PTT 網址

推

superAchung 01/30 07:35消息一堆，但我只相信真金白銀交易的投資人，看這三

→

superAchung 01/30 07:35天NV, tsmc adr 股價就知道了

推

humorforever01/30 07:46青鳥：DS有沒有台灣價值，沒有就是垃圾

→

qxpbyd 01/30 07:47https://i.imgur.com/2TppMS1.png

推

FK6819 01/30 07:48少年股神：崩盤時就是世界末日

→

qxpbyd 01/30 07:48小模型套完是真的會變強的

推

haklim 01/30 07:49開盤會跌多少

推

guybejude 01/30 07:50推結論

→

HAPPYISCASH 01/30 07:51台灣人素質比美國人爛多了

→

HAPPYISCASH 01/30 07:51reddit一堆專業文

→

HAPPYISCASH 01/30 07:51台灣人只會在那邊64

→

HAPPYISCASH 01/30 07:51笑死

→

HAPPYISCASH 01/30 07:51還什麼破解言論審查的it大臣也能上新聞lol

推

neo5277 01/30 07:53驗證台灣媒體這次一半以上都是垃圾

→

HAPPYISCASH 01/30 07:53各國的論壇看一看

→

HAPPYISCASH 01/30 07:53台灣論壇素質跟回教國家差不多

推

ksjr 01/30 07:53應該是同一篇看到的英文解說youtube多一點點detail

→

ksjr 01/30 07:53https://www.youtube.com/watch?v=sGUjmyfof4Q

我整篇寫完太長了啦而且大家也沒興趣看就挑重點講而且我本身也沒完整的專業知識，所以也只能Distill? XD 但整串看下來，有些人連distill都不會.....

→

HAPPYISCASH 01/30 07:54回教社會隨便一個文章都能扯到宗教對抗

→

HAPPYISCASH 01/30 07:54台灣是隨便一個文章都能扯到抗中保台

→

HAPPYISCASH 01/30 07:54北七

→

ksjr 01/30 07:54還有重建r1的github 有心志士們快衝啊!

→

ksjr 01/30 07:54https://github.com/huggingface/open-r1

推

neo5277 01/30 07:55這篇算完整，但股版講這麼細喔，我前幾篇都沒講想

→

neo5277 01/30 07:55說真的有人會想看嗎

→

newwu 01/30 07:56DS 的技術當然是真的，對開發LLM和推理模型也很有

→

newwu 01/30 07:56幫助，但也確實蠻有可能在中間用到ChatGPT 的生成去

→

HAPPYISCASH 01/30 07:56台灣是說你五毛粉紅支那

→

HAPPYISCASH 01/30 07:56回教是說你真主阿拉的叛徒

→

HAPPYISCASH 01/30 07:56笑死

→

newwu 01/30 07:56微調，美中如何出手和股市息息相關誰說不重要，這

→

newwu 01/30 07:56是股板

推

patrol 01/30 07:57大的搞的了小的，小的搞不了大的，有沒有可能以後一

→

patrol 01/30 07:57個星門就可以解決所有問題？

推

Windtears 01/30 07:59https://substack.com/@cloudedjudgement/p-1557935

推

ohlong 01/30 07:59看了一下gpro原來是ppo的變化型本來需要一個等同

→

ohlong 01/30 07:59模型規格的actor變成分組驗證在網路上一直搜尋新

→

ohlong 01/30 07:59的輸出讓RL準確性更高

推

j0588 01/30 08:00台灣就是文組誤國啊理組負責賺錢給文組亂花

→

Windtears 01/30 08:01上面文章分析很好，兩者間不影響繼續資本支出

推

linecross 01/30 08:01推這篇

推

Callus 01/30 08:02 高佳魚學姊委員就是猛打中國造假還上YAHOO頭版

推

AaronWang 01/30 08:06推

推

benson502 01/30 08:07這邊就是低能網軍互打，期待啥素質

推

james80351 01/30 08:09經過這次事件才知道台灣很多人很有勇氣愛搶著出來

→

james80351 01/30 08:09發文讓大家知道自己沒長腦

→

benson502 01/30 08:09正常台灣人連假都在日本玩，不然就是計畫出國，在

→

benson502 01/30 08:09這邊鬼混帶風向要嘛5毛要嘛1450

推

comboday 01/30 08:10嗯嗯跟我想的差不多(?

推

s77329 01/30 08:11推

推

ohlong 01/30 08:11討論到這答案大概也揭曉了 gpro是關鍵但是跟RLHF

→

ohlong 01/30 08:11相比大概只有數理這種答案對錯很明確的問題吃香

→

ohlong 01/30 08:11玩agi不小心玩出edge的未來趨勢？哈

→

benson502 01/30 08:12沒發現多數心得只有兩種嗎。5毛：中國超強。1450：

→

benson502 01/30 08:12中國製不可信

推

RTAngel 01/30 08:13標準股板無用文

→

tctv2002 01/30 08:14看台灣的評論會覺得DS是假貨一堆假專家

推

cphe 01/30 08:18推，做股票還在意識形態根本就找死而已，當然是看

→

cphe 01/30 08:18哪邊有利就壓哪邊

→

demintree 01/30 08:19distillation不是微調啊，會有爭議的是他拿別人的大

→

demintree 01/30 08:20模型來當他自己的訓練

→

demintree 01/30 08:21MoE也不是新概念，其實OpenAI和Gemini裡面都是

其實很多小模型都用別人的模型來訓練阿然後Distillation應該是指V3的部分? 但V3本身是"Nothing"，R1對V3的演算法才是重點 V3水準一堆開源都做得到

推

ksjr 01/30 08:21樓上沒看解說齁?r1是蒸餾自己的model欸

→

demintree 01/30 08:22結論是他們很有效率的用其他人的模型為輔助產生了新

→

demintree 01/30 08:23的模型，這對於很多新進廠商很有幫助

推

gogorice 01/30 08:23不懂又愛鬼扯太多，跟舊版chatgpt一個德行

→

demintree 01/30 08:23誰跟你說他只有蒸餾自己的model?

推

harlenshaco 01/30 08:24推

推

Fezico 01/30 08:25看不懂的跟我去洗碗就好惹

→

newwu 01/30 08:26應該說很多不太懂的人在討論可不可能盜用ChatGPT，

→

newwu 01/30 08:26都是以完全蒸餾的前提，這前提就錯了，有盜用的話，

→

newwu 01/30 08:26可能只有部分用到gpt的生成，例如起頭或收尾

推

lusifa2007 01/30 08:29你自己說更多企業能夠自行建置自家的AI 又說硬體

→

lusifa2007 01/30 08:29需求會減少？供三小

因為算力需求等級不同啊小模型專精領域+RL不需要那麼多硬體那個是等比級數的差異

推

wayne0530 01/30 08:29台灣很多人沒在思考的

推

IanLi 01/30 08:30推，進步的人去學習理解，而不是降階成意識政治戰

→

IanLi 01/30 08:30爭

推

rebel 01/30 08:31幫推程式碼都開源了不嘗試去驗證它找投資機會

→

rebel 01/30 08:31整天在那邊中國一定是假的這樣會賺錢嗎

推

icecoldcola 01/30 08:33因為台灣就只剩下意識形態了

→

demintree 01/30 08:34R1應該是MoE版的V3，並不是V3 distallation

→

zzahoward 01/30 08:35但V3其實一堆開源都做得到了 V3非常不怎樣

→

newwu 01/30 08:36在這種算法開放的環境裡，算法重要厲害但不值錢，

→

newwu 01/30 08:36除非你直接屌打，搶走所有市佔，因為大家都高手，幾

→

newwu 01/30 08:36個禮拜內就能把你算法抄走了，倒頭來拼最強還是要

→

newwu 01/30 08:36拼算力

推

rebel 01/30 08:36這又不衝突算力需求的減少導致大公司不需要再買

→

rebel 01/30 08:36那麼多晶片但成本下降也讓中小公司可以進入一個

→

rebel 01/30 08:36加項一個減項誰比較多就看判斷我跟原po都是認為

→

rebel 01/30 08:37減項更大點但不是一個因素永遠只會影響一個方向好

→

rebel 01/30 08:37嗎思考別太狹窄

因為不是每間公司都需要超高算力去瞬間得到結果小模型的service provider會蓬勃成長是真的

→

demintree 01/30 08:37程式碼沒有開源啊，有的話連結給一下

→

demintree 01/30 08:37只有model和inference的放出來

→

newwu 01/30 08:37還有資料

推

ttsieg 01/30 08:38能幫助我的工作就是好工具

推

damn1120 01/30 08:41還好還有正常人但你講這麼多井蛙還是只會呱呱

推

ksjr 01/30 08:41github有人在試著重建阿d大可以去幫忙

→

demintree 01/30 08:42那就不是他開源啊，你在講啥?

多數討論是V3是GPT distillation而不是R1吧，但V3是什麼大家關注的焦點嗎?XDDD

推

gn02118620 01/30 08:42Hugging face已經宣佈要復現DeepSeek了急啥

→

demintree 01/30 08:44程式碼開源=有程式碼可以檢視他怎麼做的

→

demintree 01/30 08:44上面只有model和inference的code

→

demintree 01/30 08:45還有一些paper解釋他的想法

→

demintree 01/30 08:45用來復現的repo連結可以給一下嗎?

推

ksjr 01/30 08:46講開源的又不是我== 難怪老馬要告openai

→

ksjr 01/30 08:47上面推文自己找不然你可以問ai阿

推

sora0115 01/30 08:47推個

推

gn02118620 01/30 08:48https://github.com/huggingface/open-r1

推

eric112 01/30 08:48股板拼的是真金白銀真的沒必要在那邊搞意識形態，

→

eric112 01/30 08:48真金白銀不會騙人也是這個世界的準則之一，意識形

→

eric112 01/30 08:48態大部分都是各方利益角逐之下的產物

→

demintree 01/30 08:48上面沒有任何一個推文有復現或是開源的連結啊

推

CCNCCN 01/30 08:51整天講開源，結果什麼也沒給

推

gn02118620 01/30 08:51我不是貼了嗎？

→

gn02118620 01/30 08:52https://i.imgur.com/yzWlOPx.jpeg

→

gn02118620 01/30 08:52你是來惡搞的吧

→

gn02118620 01/30 08:53https://i.imgur.com/bjceGSQ.jpeg

這算是民間復刻不算開源XD 開源應該是官方直接打包丟出來

推

frankexs 01/30 08:55一堆鄉民只會搞意識形態

推

dmmboy 01/30 08:56青鳥和民進黨不喜歡這篇文章

噓

jin49518124 01/30 08:57最好笑的是那些吹前麵線部長的，真的丟人現眼

推

gn02118620 01/30 08:58對啊 demin不是要問復現的連結嗎

他是要官方自行放出的開源，這種復刻確實不算是開源啦但Method有公開其實算不錯了

推

Galm 01/30 09:01剛好這事件可以讓人更看清，台灣媒體的本質水準有多

→

Galm 01/30 09:01低劣

推

poeoe 01/30 09:01這個就是在專業領域方面有優勢

推

BIGETC 01/30 09:02既然人力物力不多台灣應該討論的是趕快跟上

→

BIGETC 01/30 09:02用不多

沒錯，其實我想表達的在這邊結果大家居然在討論不能問"台灣"問"64"，或會不會被中國盜帳號.....有點可笑

→

newwu 01/30 09:02這種模型訓練project 不太可能完全開源，完全開源連

→

newwu 01/30 09:02資料都要丟給大家耶

→

poeoe 01/30 09:03很適合企業針對自身專業佈建AI環境

推

icome 01/30 09:03反正扯到中國有人就會失智

推

gn02118620 01/30 09:03跟台灣媒體沒有一定的關係台灣媒體的做法是完全接

→

gn02118620 01/30 09:03受美西方媒體的說法然後刪除對中國或中國產業有利

→

gn02118620 01/30 09:03的部分放大對中國或中國產業不利的部分

我以為PTT都是受過教育的，結果像某W開頭的56一直扯一堆有的沒有的真的不行

→

newwu 01/30 09:03用他們的做法可以做出差不多的高效率就是不錯的驗

→

newwu 01/30 09:03證了

→

linahou 01/30 09:04還有人看短期股價就知道了笑死難道不知道市場會被

→

linahou 01/30 09:04乳魔影響錯誤定價

→

gn02118620 01/30 09:04這個很正常因為中美兩大勢力在激烈競爭你在中國媒

→

gn02118620 01/30 09:04體也常常看到贏麻了西方慌了之類的小粉紅言論

→

gn02118620 01/30 09:05網路時代每個人都需要對事件核心瞭解的更透徹才

→

gn02118620 01/30 09:05能避免被媒體這些工具主導你的行為

→

demintree 01/30 09:06剛剛在看上面的連結,原始的dataset是R1自身，看可以

→

demintree 01/30 09:06透過distill的方法怎麼提升

推

Axwell 01/30 09:09「我以為PTT都是受過教育的」您誤會大了吧

推

qw99992 01/30 09:09DS會讓AI應用公司門檻大幅降低

推

gn02118620 01/30 09:10我在ChatGPT問愛坡斯坦蘿莉島也會被和諧啊問以色列

→

gn02118620 01/30 09:10是否在加薩種族屠殺人口滅絕他也會政治正確啊

→

gn02118620 01/30 09:10不能在DS問64跟習近平很合理啊

推

FGK 01/30 09:11股版比較就事論事，別去政黑版看就好，反正不管怎麼

→

FGK 01/30 09:11發展TSM買下去

推

gn02118620 01/30 09:12ChatGPT會用邏輯自洽來為以色列在加薩屠殺取得正當

→

gn02118620 01/30 09:12性，DS是直接不回答但兩者本質都是言論審查只是形

→

gn02118620 01/30 09:12式不一樣而已

推

supisces 01/30 09:16台灣政府控制的媒體就是不能客觀報導中國公司的優點

→

supisces 01/30 09:17啊

→

Mytsb2421 01/30 09:17台灣綠色網紅媒體拼命帶風向

推

firemothra 01/30 09:18扯到超導體的人認為Ai都是騙局。他們才會混為一談

→

firemothra 01/30 09:18啦。笑爛

推

afrazhao 01/30 09:22推你這篇

推

whlinton297 01/30 09:24政黑網軍出蟑螂窩不是都出來洗地的嗎？呵呵

推

HeiSiaN 01/30 09:25推推

推

oneyear 01/30 09:27沒辦法，台灣有太多人聽到中國就會自動降智，這些人

→

oneyear 01/30 09:27應該不太適合投資

推

holebro 01/30 09:27要這些網紅名嘴看論文太難了

→

holebro 01/30 09:27當初看高虹安的論文倒是大家都變電腦高手笑死人哈

→

holebro 01/30 09:27哈哈哈哈哈

推

KrisNYC 01/30 09:29學習到了

噓

WindSucker 01/30 09:30這是中國自主研發的

推

turndown4wat01/30 09:31這樣meta之後還敢開源模型嗎

→

zzahoward 01/30 09:34不用看論文阿你去reddit專版裡面討論風氣都很好

→

zzahoward 01/30 09:35尤其是技術性的東西裡面很多解釋都很中立而且很清

→

zzahoward 01/30 09:35楚

推

j0987 01/30 09:37存

推

tonylolz 01/30 09:38你是中吹?買A股了嗎?

→

jyan97 01/30 09:39台灣這次真的蠻誇張的，論文跟開源都出來了結果講

→

jyan97 01/30 09:39技術的沒幾個，一堆阿貓阿狗開吹開嘴

推

Axwell 01/30 09:40因為懂技術的沒多少人扯政治比較有收視率

噓

r40491101 01/30 09:41中國製造，先打問號

噓

nmjkluiop 01/30 09:44最後只會大模型吞小模型軍備競賽依然持續

邊際成本問題太多人不了解CAPEX支出模型了

※ 編輯: zzahoward (1.163.78.138 臺灣), 01/30/2025 09:46:21

噓

r40491101 01/30 09:45Reddit一致好評那是因為你跑去中國人創的community

→

r40491101 01/30 09:45，我在歐洲還沒聽過有人說deepseek好用，你乾脆去看

→

r40491101 01/30 09:45askchinese不是比較快

→

zzahoward 01/30 09:47歐洲AI的發展...?

→

hen5566 01/30 09:48歐洲...XD

推

Redfeather 01/30 09:49玩技術的還想要跨過中國產出的資訊我只能說你很勇

→

r40491101 01/30 09:49便宜是便宜，但效能就是只針對特定資料集測，實驗室

→

r40491101 01/30 09:49內時速180，實驗室外直接翻車，這個就是中共release

→

r40491101 01/30 09:49出來騙數據的，已經report會用個人資料外漏風險

推

rivual 01/30 09:49我體感用起來怎麼是R1比較囉嗦，但我喜歡它完整分享

→

rivual 01/30 09:49推理過程

推

yesyesyesyes01/30 09:50難得看到股版有水準的文章，一堆不是搞ai 的人在那

→

yesyesyesyes01/30 09:50邊亂扯就無言

→

r40491101 01/30 09:50你去看reddit就是歐洲，美國也該去看X

→

Rattlesnake 01/30 09:53主要是要看他的primary model 怎麼來的它更像加

→

Rattlesnake 01/30 09:53個前置後置先對prompt處理再丟到基礎模型產

→

Rattlesnake 01/30 09:53出後再處理一遍這個外加模型成本自然小重點是

→

Rattlesnake 01/30 09:53基礎模型產生的過程

推

Aliensoul 01/30 09:54在台灣只要會操作意識型態就可以賺錢了

→

newwu 01/30 09:54怕資料被中國看就下載小版本本地run啊

→

newwu 01/30 09:54Project digits才3000塊耶

→

Rattlesnake 01/30 09:57gpt4是不如它 got現在要拿o1跟它比才能壓制

噓

kadolong 01/30 10:03所以咧?? 不就一樣的東西

推

G8AJ 01/30 10:10党還是覺得點麵線比較強党的信徒深信不疑

推

gbman 01/30 10:10青鳥:沒有台灣價值CC

推

icexfox 01/30 10:14推推

推

void06 01/30 10:16青鳥表示肯定中國就是中共代理人

→

c928 01/30 10:20自己人沒事兒

推

hank121314 01/30 10:25推

→

a9564208 01/30 10:26現實就是查公司內部資料庫的AI不用回答摩鐵怎麼訂(

→

a9564208 01/30 10:26還是其實有需要？)

噓

aac219oo 01/30 10:27這消息早就不是新東西了 llm剛出來的時候就一堆碼

→

aac219oo 01/30 10:27農在分析生成方式只有87台灣人還在自己的小圈圈自

→

aac219oo 01/30 10:27嗨

推

qscNERO 01/30 10:28推

推

evankkk4816 01/30 10:29推

推

anaydh 01/30 10:30推這篇

推

ImMACACO 01/30 10:32推

推

hahaxd78 01/30 10:33推

推

Carloslin 01/30 10:42推但是文組青鳥會視而不見

推

cool9203 01/30 10:43誰還在講歐洲llm的發展，都已經拿法規砸爛所有llm

→

cool9203 01/30 10:43了，何來的發展，笑死

推

william4568201/30 10:48理性思考

推

joke3547 01/30 10:48推一個，真心建議政治廚別再影響台灣學術界了

→

howardyeh 01/30 10:50我反而覺得AI股價不準，因為想上車的人太多了，搞下

→

howardyeh 01/30 10:50來才好進場

推

Syoshinsya 01/30 10:54瞎扯是牠們的工作，不過「我以為PTT都是受過教育的

→

Syoshinsya 01/30 10:54」，這個真的是天大的誤會 XDDD

→

bnn 01/30 10:54畢竟政府忙著花你稅金造謠啊

→

saisai34 01/30 10:55意識形態是可以選擇性降低智商的 @@a

推

sid3 01/30 11:19政確不需要智商我唐鳳世界第一

推

mlda888 01/30 11:25推個

推

lorhokok 01/30 11:25推

推

rkilo 01/30 11:37推清醒的人

推

kuso198610 01/30 11:39那些說去看reddit的是看哪版我目前在幾個AI相關

推

kentano 01/30 11:39看來至少Openai被破解了

→

kuso198610 01/30 11:40都是對DS的言論審查反感但讚賞它的開源,對於OpenAI

→

kuso198610 01/30 11:41大多都是在酸Y

推

CaTkinGG 01/30 11:42人家開源技術回饋給全世界卻用意識形態看有點可惜

推

kentano 01/30 11:52居然有學生說沒有原始程式碼不是開源

→

kentano 01/30 11:53服了幾百萬鎂的案子還要把原始碼交出來嗎

推

kuso198610 01/30 11:53我是不知道為啥一票台灣人把OpenAI當神拜

→

kuso198610 01/30 11:54他們是很大沒錯啦但在這個領域爭議也是很多捏

→

demintree 01/30 11:55沒有要交出來，而是你不開放程式碼不叫做開源啊

→

demintree 01/30 11:56人家根本沒有開源碼，一堆人不懂還幫亂吹

推

Greefacy 01/30 12:12推

推

small314 01/30 12:20藍白粉自己先造謠一條龍又怪青鳥網軍上車喔？？邏輯

→

small314 01/30 12:20？

噓

cdcardabc 01/30 12:25一堆中吹借題發揮貶低台灣跟美國啊

推

cheng399 01/30 12:27有推文頗呵笑死

推

jecint1707 01/30 12:31專業推尤其又有圖表看的真舒服

推

sowulo 01/30 12:32臺灣這幾天真的好多無用的資訊帶意識形態瞎吹硬貶

→

sowulo 01/30 12:32的太多了想找專業的還是看國外的文章吧

推

Brioni 01/30 12:33推你專業訓練鄉民理解

→

sarspieya52101/30 12:35想賺錢就別帶什麼意識形態

推

bitcch 01/30 12:37現在inference還要一定成本更別說training資源不是

推

jickey 01/30 12:37某板都說這裡吹DS已經被藍白佔領了

→

bitcch 01/30 12:37幾張家用顯卡就能負擔只是讓LLM調教門檻下放到一般

→

bitcch 01/30 12:37企業硬體需求依然在而且變大家都能參與甚至會更缺

推

SecondRun 01/30 12:44推推

→

ocwandu 01/30 12:45人家只是千萬別抬頭党這邊可是連燈都不要開

→

Arashi0731 01/30 12:46程式本來就這樣，只要在合理的範圍使用，沒有人會重

→

Arashi0731 01/30 12:46新去造輪子，善用現有的資源才對

推

ProTrader 01/30 12:48就DS的各種想法以前很多討論都有出現過

→

ProTrader 01/30 12:50像是大模型=>中模型=>小模型範圍越小精度越高

→

ProTrader 01/30 12:51如何用自動標記取代人類標記則是更久遠之前的議題

→

ProTrader 01/30 12:51這次該訝異的是為何會被中國人先推出

→

ProTrader 01/30 12:52這對那些大廠中的專業資工人絕對是很自然而然的想法

推

artjio 01/30 12:56我這幾天看deepseek時，也是一直在思考它的技術跟它

→

artjio 01/30 12:56的成果，以及針對一些技術問題過程，它的思維，讓我

→

artjio 01/30 12:56很讚嘆，結果看到新聞跟聊天一堆人在問64、天安門，

→

artjio 01/30 12:56我是蠻傻眼的...問那些跟你的日常跟工作有關嗎

推

artjio 01/30 12:58我偶爾需要跟中國人去溝通，因為公司有中、越、印

→

artjio 01/30 12:58，以前也會看B站的影片，所以知道，你不要去觸碰到

→

artjio 01/30 12:58那些有的沒的，單純談工作跟正事就好了，故意要去碰

→

artjio 01/30 12:58人家逆麟，你怎麼不去美國喊3K、跟黑人說尼哥

→

artjio 01/30 12:59每個地方都有自己禁忌的東西，尊重就好，技術本身就

→

artjio 01/30 12:59只是技術，而且還開源，就可以驗證。

推

ms07b3 01/30 13:08所以樓上到底在供三小，先紮稻草人喔

推

kuso198610 01/30 13:12有一說一 deepseek手機版式的審查是真的誇張啊

推

vicklin 01/30 13:13現在看到一個比較有意義的擔憂是成本降低要小心

→

vicklin 01/30 13:13AI落到犯罪組織手裡會不會帶來什麼風險

→

vicklin 01/30 13:14不過感覺時間線放長這也不太可避

推

ctwt 01/30 13:17推

→

WarIII 01/30 13:23當你拿真金白銀來進場選擇未來佈局什麼意識形態

→

WarIII 01/30 13:23都是假的看清局勢才能進退自如

推

MumiPyonPyon01/30 13:26GRPO根本不是這篇吧==

推

polarfox 01/30 13:27你這樣深深傷了台灣某些玻璃的心

→

faultless 01/30 13:30台灣就這樣，不少人三不五時用政治眼光來討論

→

MumiPyonPyon01/30 13:30GRPO是Group Relative Policy Optimization

推

lofiktb 01/30 13:47把問題拆成小步驟並找出一個可行解真的厲害

推

tenshou 01/30 13:55錢才是公平的

噓

ohohohya 01/30 14:26因為最一開始吹的就是在吹中國啊

推

s60324 01/30 14:29用心給推

→

beariscut 01/30 15:11脆鳥會說你不懂

推

artjio 01/30 15:14我的言論算起來是扎稻草人嗎? 如果是的話，那當我沒

→

artjio 01/30 15:14說好了，因為我是根據這幾天看到的輿論，得到的感想

推

artjio 01/30 15:17https://chatgpt.com/share/679b2756-031c-8013-

→

artjio 01/30 15:17a164-bf146842cc23 去問了一下chat gpt，看來我後面

→

artjio 01/30 15:17拿3k跟n-word比喻有失當

推

jrbobo 01/30 17:16這篇正解網軍國家隊這幾天真的很急

推

daniel3658 01/30 17:17脆鳥：有比我們添財少女懂嗎?

推

Rucca 01/30 18:30因為是中國研發的，如果是米國的就沒這些問題

推

chiro1982 01/30 19:00認真推

推

loveq4ever 01/30 19:11推

推

ganninian 01/30 19:42某族群跟某群動物以為把頭埋在土裡看不到就沒事了

→

ganninian 01/30 19:42 人家一直在進步台灣的模型在哪兩百多億預算做了

→

ganninian 01/30 19:42個點麵線系統

噓

s1001326 01/30 20:32操 99輝達快跳了

推

KrisNYC 01/30 20:38爆

推

cospergod 01/30 22:00台灣人腦殘多習慣了

推

shioyu 01/30 23:40推，分享

推

tamynumber1 01/31 09:17因為讓人少賺啊

同系列文章

Re: [新聞] OpenAI：已掌握DeepSeek盜用模型證據

其他人也閱讀了

PTT 熱門相關