PTT推薦

Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

看板Stock標題Re: [新聞] Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預作者
Lushen
(pttlushen)
時間推噓推:147 噓:6 →:335

teamblind 匿名的可能有人不信

與其聽匿名、鄉民互吹/貶

不如來聽聽 Meta 現任 CEO Mark Zuckerberg 本人對於 Deepseek AI 模型的看法

2025/01/11 Mark Zuckerberg 接受美國知名喜劇演員 Joe Rogan 專訪

截至今日有 840 萬人看過這個影片

聊到關於 Deepseek 的部分

"I mean going back to the AI conversation it's like I just think like we should all want the American companies to win at this right it's this is like a huge geopolitical compet ition and like China's running at it super hard and like we should want the American companies and the American Standard to win and like if there's going to be an open source model that everyone uses like we should want it to be an American model right it's like the there's this great Chinese model that just came out this
company deep seek um they're doing really good work um it's a very Advanced model
"

翻譯:

「回到AI的話題,我認為我們應該希望美國公司在這方面獲勝。這是一場重大的地緣政治競爭,而中國正全力以赴。我們應該希望美國公司和美國的標準能夠贏得勝利。如果未來會有一個大家都使用的開源模型,我們應該希望它是美國的模型。最近有一個很棒的中國模型推出了,這家公司叫Deepseek,他們的工作非常出色,這是一個非常先進的模型。」

https://i.imgur.com/HlQlJzk.png

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

https://i.imgur.com/70suiWR.png
圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

後面 Zuckerberg 在表達對中國 AI 發展的擔憂(例如政治政確)

完整專訪連結:

https://youtu.be/7k1ehaE0bdU?si=tDYSwADZ3Kb9FQDs&t=9717

※ 引述《Lushen (pttlushen)》之銘言:
: 原文標題:
: Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預算難以解釋
: 原文連結:https://www.jiqizhixin.com/articles/2025-01-24-2
: 發布時間:2025/01/24
: 記者署名:機器之心
: 原文內容:
: 「工程師正在瘋狂地分析 DeepSeek,試圖從中複製任何可能的東西。」
: DeepSeek 開源大模型的陽謀,切切實實震撼著美國 AI 公司。
: 最先陷入恐慌的,似乎是同樣推崇開源的 Meta。
: 最近,有 Meta 員工在美國匿名職場社群 teamblind 上面發布了一個貼文。貼文提到,國內 AI 新創公司 DeepSeek 最近的一系列動作讓 Meta 的生成式 AI 團隊陷入了恐慌,因為在前者的低成本高歌猛進下,後者無法解釋自己的超高預算的合理性。

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.229.55.152 (臺灣)
PTT 網址

ggian123 01/26 19:28不可能 大陸人吃不起茶葉蛋!!!!

s213092921 01/26 19:29https://reurl.cc/ge38NV

s213092921 01/26 19:30阿祖有本版股神懂AI嗎?哼!

TaiwanUp 01/26 19:31立昆都委婉打臉說是開源的勝利了 還在中吹

認同 比起知曉天地國際情勢的鄉民 Zuckerberg 就是個無腦中吹o'_'o

※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 19:33:36

TaiwanUp 01/26 19:33你覺得是立昆過於樂觀還是祖克柏過於悲觀

bj45566 01/26 19:36Yann LeCun 那段話在打臉 DeepSeek?我怎麼覺得他是

bj45566 01/26 19:36在諷刺堅持不開源的 OpenAI

TaiwanUp 01/26 19:39直觀上來看當然也有酸OAI 不然改成摸臉會更精準

LimYoHwan 01/26 19:40整件事最先吃屎的就是openai

fywei 01/26 19:40早看過了 看他笑笑的就知道沒在care

a655088 01/26 19:42喊了才有錢要

bj45566 01/26 19:45Yann LeCun 那篇發言的結論是:「這就是開放研究和

bj45566 01/26 19:45開源代碼的力量。」-- 到底要怎麼解讀成在打臉 Deep

bj45566 01/26 19:45Seek ???

bj45566 01/26 19:46我發現好些中黑無論在閱讀簡單的英文文章或中文文

bj45566 01/26 19:46章上都展現了八奇領域的理解能力 wwww wwww

s213092921 01/26 19:47相信股版,阿祖懂個屁AI?

TaiwanUp 01/26 19:47他先說了不要看成中國的AI超越美國 才說你上面這句

Camderela 01/26 19:48open ai 狂燒錢,不會輕易開源吧

jim543000 01/26 19:49臺灣人就是自以為很聰明 實際上在思考深度問題方面

jim543000 01/26 19:49比連心算加減乘除都不行的歐美人還差

a0808996 01/26 19:49便宜治百病

bj45566 01/26 19:49你繼續你自己都八奇領域就讀吧,你高興就好,嘻嘻

mamorui 01/26 19:50在gpt框架下生出的,還沒脫離母親的營養 ,超想看

mamorui 01/26 19:50蒸餾數據 (._.)

mamorui 01/26 19:50https://imgur.com/OcDjLK6

justdoit 01/26 19:52狂洗耶,股版沒規定一天幾篇喔?

mamorui 01/26 19:53 好像有規定? 看過安姐超過數量問過

Jeff1989 01/26 19:54我還正想說這人怎麼狂發文洗版,有人幫我說了XD

4-10. 發文限制以一日五篇(含刪文、回文)為上限,水桶七日。 為避免板友大量發文造 成洗板狀況,訂立此規。板主發公告不在此限。

mamorui 01/26 19:56學術界拿gpt生資料是不稀奇,但是絕對不可以營利喔

mamorui 01/26 19:56,可以去檢舉

Jeff1989 01/26 20:00不過DS使用體驗還是蠻OK的,對於碼農有相當的輔助

Jeff1989 01/26 20:00能力,其他類型問題回覆很有黨的風格或拒絕回答。

mamorui 01/26 20:00其實我最想問的是股點

asjh612 01/26 20:01我也比較想問股點 我第一天就有提到了 沒想到你連3

這題交給祖國的模型來回答

https://i.imgur.com/n4gCkm9.png

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預
※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 20:03:27

a28200266 01/26 20:02阿祖在那邊吵什麼 阿祖懂個屁AI

Jeff1989 01/26 20:02我也想問股點XD,連續幾篇好像跟股票沒什麼關係?

ck326 01/26 20:02股點就是七巨頭崩潰,中概股大漲,中又贏

mamorui 01/26 20:03我本來也想用股點在前面直接問,但難得看板上這麼

mamorui 01/26 20:03認真深入討論這塊,也是很難得。

super0949 01/26 20:04就是阿祖要政府別用監管卡東卡西

bj45566 01/26 20:05無聊的淡話不必重複一直講。M7 誰在靠賣 LLM 吃飯?

bj45566 01/26 20:05本業賺翻了怎麼會崩潰?

CLinna 01/26 20:06https://i.imgur.com/906pFnh.jpeg

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

mamorui 01/26 20:06所以咧?直接跟我說週一買什麼賺錢,DS大爆發總該

mamorui 01/26 20:06有標的吧

Meta? 標的? 怎麼買? 你的問題祖國模型有解答

https://i.imgur.com/OtoSa1x.png

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

與其在這邊瞎槓自己體驗一下才是真的

https://play.google.com/store/apps/details?id=com.deepseek.chat

bj45566 01/26 20:07至於誰贏?AI 競賽離結束還遠的很呢,誰還能留在場

bj45566 01/26 20:07上的都是潛在的贏家

mamorui 01/26 20:08DS既然大爆發,至少給一檔標的跟目標價 @@

※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 20:09:31

mamorui 01/26 20:09你可以就直接發一篇標的文

bj45566 01/26 20:10LLM 是更 fundamental、更高層次的大創新,LLM 出

bj45566 01/26 20:11來時請問你要買誰家?公開論文和開源碼的 Google

bj45566 01/26 20:11 嗎?可是那篇論文的作者群已經全部離開 Google 了

bj45566 01/26 20:11喔!

mamorui 01/26 20:12我對LLM怎樣沒興趣,我已經充分了解DS很棒了,希望

mamorui 01/26 20:12直接看到股點的標的文

robi 01/26 20:13https://reurl.cc/46Oye3

財聯社報導,甚至有投資者將輝達上周重挫3.12%的原因指向DeepSeek的一夜爆火。德國 《世界報》知名市場評論員Holger Zschaepitz表示:「中國的DeepSeek可能代表對美國 股市的最大威脅,因為該公司似乎以極低的成本構建了一個突破性的人工智慧模型,並且 無需使用尖端晶片。這讓人質疑投入該行業的數千億美元資本支出的實際效用。」

Pipline 01/26 20:13不知道要買誰漲?只說利空nv?那你空了嗎

robi 01/26 20:13https://reurl.cc/5DQoWn

bj45566 01/26 20:14笑死,沒有 LLM 就沒有 DS,也沒有 Meta LLaMA, Ope

bj45566 01/26 20:14nAI,... 講話前先動一下大腦好嗎???

Jeff1989 01/26 20:15其實DS用起來還蠻有意思,不過有些回答都會莫名其

Jeff1989 01/26 20:15妙加一句“在黨的領導下...”之類的,我快笑死XD

mamorui 01/26 20:17這麼多篇讓人知道DS做了突破,AI界只要有重大突破

mamorui 01/26 20:17,絕對會有標的,只想知道這個 ^o^

bj45566 01/26 20:17當初 LLM 問世時在股板掀起的討論潮和關注度遠遠超

bj45566 01/26 20:17過 DS -- 怎麼你那時候就不問股點在哪???看到 DS

bj45566 01/26 20:17 是中國公司做出來的你就渾身不對勁直說就好,不用

bj45566 01/26 20:17在那邊雙重標準假道學,噁心!

mamorui 01/26 20:18股版有討論LLM過?

mamorui 01/26 20:18沒印象 LLM有洗那麼多篇過

bj45566 01/26 20:20假如 DS 是Google 或美國的 startups 開發出來的,

bj45566 01/26 20:20你一定不會在那假惺惺的問股點呢?投資標的呢?真

bj45566 01/26 20:20的噁心!

※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 20:20:31

bj45566 01/26 20:20股板沒討論過 LLM? wwww wwww

mamorui 01/26 20:21幻覺嗎 XD https://imgur.com/MPvpCNH

Jeff1989 01/26 20:21印象中META的新聞有時也有說

mamorui 01/26 20:21你確定要討論LLM的幻覺?

peatle 01/26 20:22看起來就像是在跟政府討補助

mamorui 01/26 20:22阿祖450以後看漲到600我有在閒聊推 不用討論啊 ^o

mamorui 01/26 20:22^

mamorui 01/26 20:24阿祖450~600這段我有在閒聊推那段噴發,我是沒花

mamorui 01/26 20:24時間在外面文討論

bj45566 01/26 20:24笑死!股板討論 LLM 三年以上了,連板上罕見的真正

bj45566 01/26 20:25業內專家 LDPC 剛發的文章都在討論LLM agent -- 一

bj45566 01/26 20:25堆人推文稱讚,眼睛是瞎了嗎???

qwe78971 01/26 20:25場面話而已 做到那位置 多數都知道話要怎麼說 dee

qwe78971 01/26 20:25p目前就是成本低 設備要求低 注意這裡是指相對低

qwe78971 01/26 20:25剩下沒了 美在金錢這塊完全不用在意 更別說設備了

qwe78971 01/26 20:25 銀行多加幾個數字的事情 中這技術目前看起來也不

qwe78971 01/26 20:25是0-1 只能算是1開始 創新比複製難多了 大膽預言

qwe78971 01/26 20:25美會在這塊碾壓中 三五內年就有勝負出現

mamorui 01/26 20:26這些我知道啊 所以了解以後的股點呢 上面都有人在

mamorui 01/26 20:26問股點了

bj45566 01/26 20:26你要不要追問 LLM agent 這酷東西的股點在哪?投資

bj45566 01/26 20:26標的是什麼???

Lhmstu 01/26 20:26怕什麼,照某些人說法一定是假的啦

mamorui 01/26 20:27我前幾篇都耐心看完討論,總該給個股點吧

bj45566 01/26 20:27繼續假鬼假怪裝瘋賣傻吧 wwww wwww

mamorui 01/26 20:28這裡是股版,不問股點?

bhmagic 01/26 20:28all in 上海A股ㄚㄚㄚㄚ 上 上上上

mamorui 01/26 20:29如果直接說中概科技股,聽起來是最關聯的? 是要買

mamorui 01/26 20:29中概科技股嗎?

itwt 01/26 20:29中概股沒前途的,要買還是買美國公司啦

stlinman 01/26 20:29陰險的阿祖會這樣說可能想要補助或是捧殺,總之

cityhunter0401/26 20:30所以要吹多久啊….好幾天了!

Jeff1989 01/26 20:30中概股不曉得,目前看起來就AMD?

stlinman 01/26 20:31Deepseek看起來比歐洲的Mistral威脅來的大多了!

mamorui 01/26 20:32阿祖確實可以趁機施壓政府,不知道何時準備好攻700

mamorui 01/26 20:32,目前的攻法不算在強多的拉法

joygo 01/26 20:32叫那群華爾街不要拖後腿阿

bj45566 01/26 20:32Mistral 感覺有些雷聲大雨點小

bj45566 01/26 20:33畢竟是法國新創(誤)

cannedtuna 01/26 20:33現在的潮流不是物理模擬和無限上下文嗎

cannedtuna 01/26 20:33怎麼又回到agent了

Jeff1989 01/26 20:38Mistral也沒這麼不堪,至少能生產圖片,只能說大AI

Jeff1989 01/26 20:38時代,每間公司看起來都有機會引領市場

strlen 01/26 20:50體驗文就寫了啊 結論就是最爛 不然勒?

bj45566 01/26 20:50的確,只要還在場上,就有勝出的希望,像網路革命一

bj45566 01/26 20:50樣,最後的贏家也不只一個...

strlen 01/26 20:51優點就是開源 作功德 很棒 就這樣

mamorui 01/26 20:51沒標的的系列文,小遺憾

strlen 01/26 20:51最大衝擊就是開源而已吧 API也沒人家便宜 也不賺錢

strlen 01/26 20:52到底是勝在哪?

ou787878 01/26 20:52中國不止DS,字節跳動的豆包1.5Pro也是讓人驚掉下巴

dongdong040501/26 20:52整串看下來就那幾個ID崩潰狂跳針,承認人家厲害好像

dongdong040501/26 20:52很困難一樣

strlen 01/26 20:53去看我寫的那篇實測啊 厲不厲害你嘴巴上講喔?

mamorui 01/26 20:53市場一堆人都想喝湯 @@

strlen 01/26 20:53不然你寫一篇實測看他有多厲害打爆o1跟gemini

bj45566 01/26 20:54鄉民的體驗文可信度?嘻嘻 wwww 怎麼台大資工畢業

bj45566 01/26 20:54的那位板友分享的體驗還蠻不錯的 -- 政治不正確被某

bj45566 01/26 20:54些人直接無視了嗎?

strlen 01/26 20:54東吹西吹 不如自己體驗啊 沒錯阿 你的體驗文勒?

strlen 01/26 20:54信啥 我都公開方法 你可以自己照著測啊

mamorui 01/26 20:54邏輯錯了 https://imgur.com/Ya72IbV

strlen 01/26 20:54一張圖 一個prompt 你就自己去測那幾個AI 不就得了

mamorui 01/26 20:55幾何數學錯了 https://imgur.com/1EERwjX

strlen 01/26 20:55好像我藏了什麼測試方法一樣?啊就普通生產力用途

strlen 01/26 20:55還不是測什麼數學題勒

strlen 01/26 20:56啊原PO不是叫我們回去自己體驗 體驗了啊 怎了

strlen 01/26 20:56就說吹都很厲害啦 一用就看破手腳 笑死

mamorui 01/26 20:56真的 我拿簡單數學題測 結果錯了 還沒到生產力的部

mamorui 01/26 20:56分 QQ

strlen 01/26 20:57最實際的體驗你不看 你愛看bechmark喔 就好像花大錢

strlen 01/26 20:57買了遊戲顯卡跑分嚇嚇叫 結果都不玩遊戲 因為一玩就

strlen 01/26 20:58卡爛 只能看跑分高潮 說的就是以前的A卡啦 哈

strlen 01/26 21:00雖然實際用最爛 但人家開源 沒啥好嫌也是真的啦

mamorui 01/26 21:00嗯嗯 因為R1強調數學邏輯coding 我也是針對特性給

mamorui 01/26 21:00測試 沒有刻意測非他強項的題目 也不是用弱智吧陷

mamorui 01/26 21:00阱題

bj45566 01/26 21:04那道數學題 OpenAI 的免費版產品有算對嗎?

mamorui 01/26 21:06當初這兩題網路上就是在找能算對的,邏輯題的有兩

mamorui 01/26 21:06家有,數學題討論到最後沒說o1有沒有測試過

mamorui 01/26 21:07如果DS作為posttrain上表現數據優異,我本來想說可

mamorui 01/26 21:07以直接都測對

mamorui 01/26 21:10如果DS R1的數據大概相當,其實我覺得還好,也可能

mamorui 01/26 21:10我用官方的chat,R1或許是lite或preview版

good5755 01/26 21:10網路上分析DS的文章和影片很多 不用無腦黑也不用無

aac219oo 01/26 21:10嘴支那的 vue3瞭解看看 台灣連一個狗屁都開發不出

aac219oo 01/26 21:10

good5755 01/26 21:11腦吹 事實上他就是一種優化AI資料庫算法的一種方式

good5755 01/26 21:12用比喻就是chatGPT整個大模型從0到1 DS可能是1到1.5

mamorui 01/26 21:12現在我也是拿有人討論的問題來問,當初strawberry

mamorui 01/26 21:12的r幾個也是吵了很久,我們小組討論一定都會demo時

mamorui 01/26 21:12順便看這些爭議題

good5755 01/26 21:12有貢獻但還沒有到革新的地步 就是優化流水線

good5755 01/26 21:13未來還是要比算力和資料庫

AirLee 01/26 21:13AI這賽道本來就還在幼兒階段,誰會笑到最後其實不

AirLee 01/26 21:13好說。

mamorui 01/26 21:13畢竟AI推理的最終目的是要維持正確率的

good5755 01/26 21:14我看了很多分析 DS也是由於資料庫大才能分數高

good5755 01/26 21:14但是要邏輯生成答案上 還是略遜一籌

bj45566 01/26 21:14我查到 2024 年 12 月 10 一篇在臉書社團的貼文,Ch

bj45566 01/26 21:14apGPT 也算不出來那一道數學題喔

good5755 01/26 21:15算數學很強 但是你丟個問題要他生成網頁或答案

good5755 01/26 21:16就會出現一堆BUG 技術還是不成熟

strlen 01/26 21:17https://i.imgur.com/7k6GHd7.png 幫你跑啦 滿意嗎

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

bj45566 01/26 21:19我是問那道板友說「簡單」的數學題

bj45566 01/26 21:26請問是看不懂中文嗎?

bj45566 01/26 21:29那道邏輯題非常簡單,DS 的表現太落漆;但那道數學

bj45566 01/26 21:29題能說是「簡單」嗎?mamorui 用的形容詞有點奇怪

strlen 01/26 21:31哭什麼 跑也要時間 不會自己測喔 花錢啊

strlen 01/26 21:31伸手牌喔?測一堆東西還要爭 你貼篇測試文出來講阿

strlen 01/26 21:32躲推文裡喊 喊什麼啦 半桶水 自己體驗這麼簡單不會?

atlaswhz 01/26 21:32AI附加黨的限制條件,是不可能彎道超車的

strlen 01/26 21:32看你寫一堆 從頭到尾沒看過你玩過AI 都空話就對了

okderla 01/26 21:34幫問問怎麼消滅中國共產黨:)

strlen 01/26 21:34Gemini ChatGPT Claude都解不出這道數學 o1 pro我沒

strlen 01/26 21:35買測不了 你測啊

strlen 01/26 21:35啊至少到目前為止 是不是都實測?不像有人 吹

mamorui 01/26 21:36我只有copilot的o1, 沒辦法測那題數學 QQ

mamorui 01/26 21:37只能玩到這 https://imgur.com/PXC5svP

strlen 01/26 21:38我體驗文就不看這些很像考試的題目 就最實用性的

strlen 01/26 21:38誰平常會需要解這些無聊的題目?就算有也極少吧

strlen 01/26 21:39碼農產code不就最大宗的生產力擔當?這AI不就宣傳拿

strlen 01/26 21:39來寫code最適合 我就用它最推薦的需求體驗耶

mamorui 01/26 21:39嗯 要跟自己工作或常用有關 不過我沒帶電腦出門 不

mamorui 01/26 21:39方便測code的部分 QQ

strlen 01/26 21:40不過 還是那句老話 反正吹成本低 又開源 就無敵了

mamorui 01/26 21:40所以只好玩數學跟邏輯題 數學還是用的到 尤其幾何

mamorui 01/26 21:40繪圖的 QQ

strlen 01/26 21:40第一次看到股板這麼喜歡功德企業耶 真奇妙

bj45566 01/26 21:42奇怪,我從頭都沒問那道邏輯題,我只問那道「簡單」

bj45566 01/26 21:42的數學題 -- 自己多事,被刺到又惱羞,笑死人 wwww

bj45566 01/26 21:42 wwww

mamorui 01/26 21:43那道題很難嗎 國中或高中的吧

strlen 01/26 21:43不爽你伸手牌啦 兩題都幫測也要時間在那邊該該叫

mamorui 01/26 21:44因為R1在數學數據庫分數也表現比較好,要能測過不

mamorui 01/26 21:44是應該的嗎

mamorui 01/26 21:45這數據很猛耶。https://imgur.com/SrEchOd

bj45566 01/26 21:45我早就在推文説過我四十多歲而且經濟自由準備退休了

bj45566 01/26 21:45,我工作上有助理,沒有使用還很青澀 AI 產品的動

bj45566 01/26 21:45機,我只等智慧居家照護機器人商業化

bj45566 01/26 21:47高中沒教幾何題,所以 mamorui 是說那道題是國中生

bj45566 01/26 21:47程度喔?

mamorui 01/26 21:48而且你跟我掛保證說數學真的有好, 我才找有人餵過

mamorui 01/26 21:48其他LLM, 但應該能測試出差異的數學題來問, 我問大

mamorui 01/26 21:48部分會對的沒意義。

strlen 01/26 21:49退休乾這P事喔?我也早就沒在上班放假玩玩AI而已有

strlen 01/26 21:49很難膩?懶又只會該該叫.....

bj45566 01/26 21:50我有保證 DS 的數學很好?請 Google 出來打我臉啊!

strlen 01/26 21:50大過年在家閒著沒事幫測AI也要在那邊該 哭三洨喇

strlen 01/26 21:51DS自己宣稱就解數學寫程式很屌啊不測這個測洨喔

bj45566 01/26 21:52是啊,你會玩 GPT -- 結果解連一個網友說的「簡單」

bj45566 01/26 21:52數學題目都操作,好笑 wwww

mamorui 01/26 21:52喔 記錯了 你說OpenAI數學好 XD

bj45566 01/26 21:52國中程度的喔 wwww

mamorui 01/26 21:53我沒辦法測o1, DS又超越大家, 所以我想DS數學要好

mamorui 01/26 21:53

mamorui 01/26 21:54我之前就說數學不行了

JoshBeckeet 01/26 21:55終於有一篇正常的...

bobogei8112301/26 21:56認真說開源跟便宜還真的可以吹 很多公司都想做 fine

bobogei8112301/26 21:56 tune 或額外加架構 所以以前才會有人用 llama 系列

bobogei8112301/26 21:56 現在多這個媲美o1的 肯定會掀起一波風潮

bj45566 01/26 21:56我講的好壞都是根據論文的benchmark charts -- 數

bj45566 01/26 21:56學的好壞,幾何題尤其明顯,根本不能光靠一題定生

bj45566 01/26 21:56

mamorui 01/26 21:57沒錯, 大多是都走posttrain, pretrain那個燒錢只

mamorui 01/26 21:57有幾個大的搞

mamorui 01/26 21:58strawberry的事鬧多大

bj45566 01/26 21:58公開的重要論文和開源碼如果 benchmark charts 造

bj45566 01/26 21:58假,自有人會檢舉質疑

mamorui 01/26 21:59那我怎麼判讀那些數學可以問,至少要高中題全都行

mamorui 01/26 21:59吧 大學以上我可以不要求

mamorui 01/26 22:02我也沒找碴挖個邏輯陷阱來測,就只是找個有人在AI

mamorui 01/26 22:02群組正常問過想試試看的題目,沒爭議的題目又看不

mamorui 01/26 22:02出差異,我們小組報告也會被問一些特別問題測試。

strlen 01/26 22:04就是benchmark不能定生死我才寫工作實務體驗文啊...

strlen 01/26 22:04寫了又不看 還在吹 可悲

bobogei8112301/26 22:04拿下一次的AIME或是codeforces的比賽最準啦 不可能

bobogei8112301/26 22:04在訓練集的

strlen 01/26 22:04還是又要吹寫小說比較強 好吧那DS專門寫小說好了 呵

bj45566 01/26 22:04所以大學聯考數甲考滿分的才能評價為數學好???

lusifa2007 01/26 22:06蜥蜴人的話參考就好 看看meta現在的政策

mamorui 01/26 22:07AI不考滿分? 那我不如問我旁邊的台大同事ˊ_>ˋ

strlen 01/26 22:08codeforces比賽沒屁用喇 你工作上真正用到就碼農產

strlen 01/26 22:08code 比賽跑滿分但不會切版是有什麼鳥用?

mamorui 01/26 22:09R1主打數學推理又加上評分更高,如果拿V3,那我就

mamorui 01/26 22:09不會很在乎數學了。

mamorui 01/26 22:11strlen大你真的說對了,我們搞模組的人寫測試有需

mamorui 01/26 22:11要UI的,有卡某個版面的設定我把code給對方過 XD

mamorui 01/26 22:14能唯一震驚國高中生的就是,如果DS可以考學測滿分

mamorui 01/26 22:14的話,這paper就真的很頂。

strlen 01/26 22:15這兩天測 心得就很簡單 實用度還是被抬面上大咖屌打

mamorui 01/26 22:15以現有框架下,因為pretrain階段理論上所有國高中

mamorui 01/26 22:15數學的資料都看過,就是差怎麼完美學會應用,postt

mamorui 01/26 22:15rain終極目標就是在搞這個。

strlen 01/26 22:15但人家開源 可以免費玩 還可以商業化 大家就吹起來

strlen 01/26 22:16講成本多低聽聽就好啦 中國企業哪個沒在卷 哪天看到

strlen 01/26 22:16幻化突然倒掉或被收購也不用太ey

strlen 01/26 22:17免費開源我可以下載回家用我的4090跑 雖然等級比o1

stosto 01/26 22:17沒錢的就去用,沒預算問題的還是選open ai

strlen 01/26 22:17差了點 但堪用 這就好棒棒了 阿祖的羊駝也是玩這個

strlen 01/26 22:18不但可免費 重點你可以載回去 商業化 這樣多好啊

mamorui 01/26 22:18嗯 我唯一可以確定的是,理想posttrain最高境界是

mamorui 01/26 22:18真的可以考滿分,因為pretrain都有看過了,我還不

mamorui 01/26 22:18是講AGI。

stosto 01/26 22:18只要能讓你工作效率提升都是好東西

strlen 01/26 22:18我有錢買幾台伺服 模組調一調也可以開API收錢

stosto 01/26 22:20基本上用ai你還是要有一些基本的知識才會用的快跟

stosto 01/26 22:20有效率

xeins 01/26 22:20所以接下來是規格之戰 讓我想到av帝王 主導規格的永

xeins 01/26 22:20遠是瑟瑟

pobby2266 01/26 22:21便宜治百病 我現在日翻中api就掛Ds

s0920151048 01/26 22:22中國吹不得 台灣沒得吹

strlen 01/26 22:23台灣不用吹 沒有台灣 你各位現在還在地上爬

strlen 01/26 22:23沒有竹科 AI爆發再等20年

mamorui 01/26 22:23可以吹啊 重點是股點呢 週一買什麼?

s0920151048 01/26 22:24真的是沒東西吹 笑死

strlen 01/26 22:26去年台股漲幅全球第二 吹什麼?笑死

strlen 01/26 22:26DS好棒棒 開源作功德 鹿港有噴嗎?吹?

s0920151048 01/26 22:27一隻猴子跟一個llm就讓一堆人崩潰 真的不要再繼續

s0920151048 01/26 22:27了 你乾脆說沒有人發明程式語言ai就不會爆發好了

s0920151048 01/26 22:27這樣邏輯比較符合你的想法

strlen 01/26 22:28這邏輯連猴子都懂就你不懂我有什麼辦法?

strlen 01/26 22:28崩潰啥?我評測都寫了 你沒崩你寫一篇吹一下啊

strlen 01/26 22:28倒看你有何高見?寫不出來對不對?

strlen 01/26 22:29台股漲幅全球第二也是數據 不然勒?哪一點非事實?

mamorui 01/26 22:30不是啊 這整系列要吹的人顯然不是要吹鏟子,那總要

mamorui 01/26 22:30給個股方向吧?

mamorui 01/26 22:30按照DS的突破話題熱度,不是這一個月要大噴、就應

mamorui 01/26 22:30該是長線等級的個股吧,講到現在也沒說哪一檔?

Haerin520 01/26 22:31中國就是爛 祖克柏有酸民懂AI嗎

Haerin520 01/26 22:32台灣有台積電怕什麼

bj45566 01/26 22:32@mamorui:你原話是說高中題目都解的出來喔 -- 有這

bj45566 01/26 22:32種數學能力就代表隨便抽十份建北的聯考數甲模擬考

bj45566 01/26 22:32卷,AI 要全部都考滿分喔!你在講的甚至超過 AGI

bj45566 01/26 22:32 簡直是 ASI 了你知道嗎???

gk1329 01/26 22:32中國有14億人 又有996

s213092921 01/26 22:33https://youtu.be/WEBiebbeNCA

mamorui 01/26 22:33我是說理想,等你實測啊,我測不出來DS R1這水準

gk1329 01/26 22:33華人智商又世界領先 會有這擔憂很合理鴨

s213092921 01/26 22:34美國有三億人,但他們有496,凌晨4點幹到晚上9點,

s213092921 01/26 22:34每週6天反覆XD

gk1329 01/26 22:34西方很多智者有危機意識不是沒道理

bj45566 01/26 22:34跳三級考上台大醫科的超級資優生都達不到你的數學好

bj45566 01/26 22:34「定義」,在搞笑嗎?

bj45566 01/26 22:35理想?根本是鬼扯好嗎!

mamorui 01/26 22:35不是啊,那題數學如果在學測裡,是很難的題目嗎?

gk1329 01/26 22:35人家擔憂 就抹紅說人唱衰自己國家 這樣好嗎= =

mamorui 01/26 22:36是理想啊 李鴻毅老師的導論課就提到pretrain data

mamorui 01/26 22:36的特色

s213092921 01/26 22:38https://b23.tv/rZna069 B站的部分翻譯影片

mamorui 01/26 22:40R1主打數學邏輯Coding, 難道正確率不重要嗎? 那我

mamorui 01/26 22:40要怎麼使用?

mamorui 01/26 22:41數學邏輯Coding的正確率絕對影響好用跟難用

s213092921 01/26 22:42http://i.imgur.com/acJue8A.jpg 中國DS成功的訣竅

圖 Meta陷入恐慌?內部爆料:在瘋狂分析複製DeepSeek,高預

s213092921 01/26 22:42:當美國人休息時,中國人還在工作

bj45566 01/26 22:43你原話是說高中的題目都會做,馬上就翻臉不認帳了

bj45566 01/26 22:43嗎?

s0920151048 01/26 22:43對對對 你真懂行 厲害厲害 隨便講一句就跳起來真的

s0920151048 01/26 22:43很好笑 你那文我也看過了 就數學學問題丟參考書這

s0920151048 01/26 22:43招我也用過 邏輯不比你差 我們都一樣呢

s213092921 01/26 22:44中國AI公司樂見美國繼續砸幾百億美元在無謂的地方XD

s213092921 01/26 22:44D,你只會砸算力,我重視算法優化

strlen 01/26 22:44不要整天只會貼東貼西 自己下去玩 下去體驗 好嗎

strlen 01/26 22:45原PO都這樣講了 你們為什麼連APP都不肯下載回去用?

mamorui 01/26 22:45因為你問這個 https://imgur.com/xRtErqu

strlen 01/26 22:45我好歹也測了好幾題了吧?要不你們自己測嘛

bj45566 01/26 22:45再講一次,高中模擬考數甲試卷每一份都能考滿分的

bj45566 01/26 22:45能力,絕對是超越人類,你就是鬼扯跳針!

mamorui 01/26 22:46所以我才說AI是要這樣沒錯啊 AI的目標不是應該這樣

mamorui 01/26 22:46

bj45566 01/26 22:46奇怪,是你先說要高中的題目全部都會做才合格的

mamorui 01/26 22:47蛤? 學測考滿分就叫做AI超越人類?

s213092921 01/26 22:47當年耗死蘇聯的軍備競賽迴旋鏢,終於打回到美國頭上

s213092921 01/26 22:47了XDD

bj45566 01/26 22:47AI 什麼時候保證解數學能力超過世界上所有人?

mamorui 01/26 22:47我不是說了我沒要求大學的水準嗎

mamorui 01/26 22:47我已經說了 我沒要求大學的數學水準了

strlen 01/26 22:48那葛alexandr wang你要信他 他還說DS騙人訓練用了5

mamorui 01/26 22:48考學測滿分就叫做AI超越人類?

strlen 01/26 22:48萬張AI卡成本根本虛報勒 要信嗎

bj45566 01/26 22:49我是說聯考數甲,而且是隨便抽任何一份試卷都要考

bj45566 01/26 22:49滿分,每份都是滿分 -- 你自己說高中題目都要解的出

bj45566 01/26 22:49來才合你的意

strlen 01/26 22:49https://tinyurl.com/mrw78ds8 你各位最愛的中時

信了 Scale AI出身名門 Alexandr Wang表示,DeepSeek的R1模型在他們公司的測試下,與目前所有最出色的模型 不相上下甚至超越,顯示美國的出口管制措施,以及AI晶片與技術禁售令沒有阻礙大陸人 工智慧發展的速度。 Alexandr Wang沒有說虛報 擁有多少NV晶片是一回事 訓練麼形用了多少是一回事

mamorui 01/26 22:50當然 AI生不出滿分天才 你敢100%相信他?

bj45566 01/26 22:50大學的工程數學也沒比高中數學難題不好解,知識量要

bj45566 01/26 22:50求更高而已

※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 22:52:11

NEWinx 01/26 22:51中國人都吃草,本來就吃不起茶葉蛋

mamorui 01/26 22:52AI沒有保證100% 但可以靠著知識提升輾壓 你覺得那

mamorui 01/26 22:52題目難 為什麼會放在國高中的學習中而不是大學?

strlen 01/26 22:52所以成本 這樣算一算 好歹也是幾個億美金來著呦

我看你是不太清醒 Google擁有數百萬顆GPU TPU=訓練Gemini必定使用數百萬顆GPU 別搞笑了

bj45566 01/26 22:53就跟你說是知識量的問題 -- 你上過大學嗎?

strlen 01/26 22:53更何況現在H100被管制 到底是花多少錢走私的?

mamorui 01/26 22:53我四大研所

strlen 01/26 22:54現在推特上一堆DS腦粉氣pupu說那葛Wang亂唬洨勒

我是沒看到所謂一堆腦粉氣pupu 倒是看到Deepseek讚揚沒有停過

mamorui 01/26 22:54國高中參加過數學科展 高中組有拿佳作

mamorui 01/26 22:54國中組老師出力多 但有拿第二名

strlen 01/26 22:55喔所以購買成本不計喔?好喇 那乾脆水電人事也不計

三小 論文裡面的成本是指訓練出該模型耗費的成本 真的槓精一個

strlen 01/26 22:56然後國家補個十億八億也可以扣掉了 這樣我信喔

strlen 01/26 22:56自己去Wang推文底下找啦 一堆罵

strlen 01/26 22:57論文寫你就信喔?沒關係一堆人正在驗證喇

Alexandr Wang表示,DeepSeek的R1模型在他們公司的測試下,與目前所有最出色的模型 不相上下甚至超越 哪次不驗證

mamorui 01/26 22:57反正你堅持這樣AI的數學就算夠好是吧, 聽你的話完

mamorui 01/26 22:57全相信AI的數學

strlen 01/26 22:58我實務用就是最爛阿?不然你測嘛

strlen 01/26 22:58他公司bechmark好棒棒 實際跑呢?

mamorui 01/26 22:58實務才是真的 誰管研究結果

strlen 01/26 22:59這就回到遊戲顯卡跑分迷思阿 跑分高潮 跑遊戲笑死人

strlen 01/26 22:59你寫這麼多 你來篇實務評測 DS屌打所有模型嘛

會用一個問題的優劣去評估模型整體的好壞 真。槓精 跟義和團沒什麽兩樣

strlen 01/26 23:00但我保證你絕對寫不出來 因為 你 只 會 吹

對啊 Meta CEO 只會吹嘻嘻

strlen 01/26 23:01我們測了碼農產code 測邏輯題 測數學 你測了啥?

測了你是個槓精

strlen 01/26 23:01槓精都比你吹仔強1000倍 你蛇麼也沒有 只會貼跑分

好哦承認4槓精就好

mamorui 01/26 23:01真的 而且實務要跟數學邏輯Coding相關 不是這類的

mamorui 01/26 23:01實務工作者 其實V3就夠了

strlen 01/26 23:01還不是一個問題勒 好幾個惹 就說你貼啊

槓精義和團表示:

huabandd 01/26 23:02DS好不好我不知道,但阿祖說的話能信嗎?

我信PTT槓精鄉民的

strlen 01/26 23:02阿祖哪一段說DS屌打所有模型 你又造謠了喔

strlen 01/26 23:03你找出來啊?他有說DS屌打所有模型嗎?快找啊

槓精 槓到幻覺都出現了 我484說惹Deepseek在湊合的成本模型上很不錯嘻嘻

strlen 01/26 23:03造謠還抹黑 你還會啥?

strlen 01/26 23:04槓精有評測 你只會造謠跟吹?高下立見囉 誰才是槓精

槓精鳥不要這麼氣

strlen 01/26 23:04我評測全真實無誤你驗證啊 誰才是幻覺+造謠 很清楚

strlen 01/26 23:05好了喇 什麼評測都寫不出來 可憐哪

槓精 幻覺沒治好前別出來亂乖

※ 編輯: Lushen (36.229.55.152 臺灣), 01/26/2025 23:06:57

bj45566 01/26 23:06國高中參加數學科展? wwww

mamorui 01/26 23:08所以我要求AI數學好點是習慣, 尤其工作有幾何的需

mamorui 01/26 23:08求, R1跟o1這程度自然還不夠好 ^o^

mamorui 01/26 23:09我真的國高中都參加數科展 我發誓講謊話天打雷劈

bj45566 01/26 23:11我大學聯考上台大電機,班上程度最好的同學國中小

bj45566 01/26 23:11跳級、全國二類組前幾名進入同系 -- 他高中模擬考

bj45566 01/26 23:11的數學只有兩次考九十出頭,聯考 95,月考印象中也

bj45566 01/26 23:11沒考過滿分

mamorui 01/26 23:12所以咧 你剛想拿學歷喬不起人嗎 呵呵

bj45566 01/26 23:13然後我今天才知道 AI 「數學好」的標準竟然是要能

bj45566 01/26 23:13解出所有的高中題目,真的是笑死 wwww

mamorui 01/26 23:13我在閒聊從不拿學歷做這種事 ^o^

mamorui 01/26 23:14不然咧 工作就是有機會用到國高中數學應用 直接找A

mamorui 01/26 23:14I換算比較快啊

mamorui 01/26 23:15你不希望AI做翻譯都對嗎?

bj45566 01/26 23:15就是國高中參加數學科展才好笑,我認識的數學強者

bj45566 01/26 23:15參加的是數奧培訓,是高中跳級考上台大醫科,沒有

bj45566 01/26 23:15聽過去玩科展的 -- 成績不太好的同學才聽過去做那

bj45566 01/26 23:15種事

mamorui 01/26 23:15我期待AI國高中生數學題都對不過分耶

mamorui 01/26 23:16我管你認識誰 那很重要嗎

bj45566 01/26 23:16你分享你的數學經歷,我分享我自己的啊,不行嗎?

mamorui 01/26 23:17我又不在乎 跟AI數學要好有什麼關係

mamorui 01/26 23:17我在乎的是AI在數學上能像翻譯那樣愈來愈強

mamorui 01/26 23:19如果DS R1的paper能做到究極水準、又開源,那真的

mamorui 01/26 23:19是要鼓掌

bj45566 01/26 23:19期待 AI 所有的高中數學題都會不過分?嘻嘻 wwww 台

bj45566 01/26 23:19灣的理組高中數學出題就是以刁鑽聞名,我在第一志願

bj45566 01/26 23:19高中從沒遇過誰每題都會的

mamorui 01/26 23:21你為什麼不是想說,那題又沒很難,為什麼AI已經究

mamorui 01/26 23:21極式蒸餾後還是不會?

sid3 01/26 23:21Deepseek唯一的錯就是中國做的

mamorui 01/26 23:21其他幾個LLM既然都有瓶頸,難道數學能力到此為止了

mamorui 01/26 23:21嗎?

bj45566 01/26 23:23明明是拿一個目前全世界哪個AI 都做不到的超級刁難

bj45566 01/26 23:23標準 -- 請問哪家的 AI 在 AIME benchmark 拿到滿

bj45566 01/26 23:23分的?AIME 是美國版的高中數學問題

mamorui 01/26 23:24你自己說OpenAI數學已經很好了 我想說我直接測試評

mamorui 01/26 23:24測更好的DS R1 我沒搞錯吧

bj45566 01/26 23:26AIME 都拿不到滿分的,更不可能解出台灣所有出現過

bj45566 01/26 23:26的高中數甲試題,所以現今所有的 AI 數學都很爛!

bj45566 01/26 23:26比不上一位國中科展佳作的鍵盤數學高手,嘻嘻

mamorui 01/26 23:26我工作就是偶爾需要幾何空間轉換 也只是二維 這樣A

mamorui 01/26 23:26I是給錯的答案。

mamorui 01/26 23:27你其實不要堅持AI數學很好就好了

mamorui 01/26 23:27等於誤導別人什麼數學題都可以問

bj45566 01/26 23:29OpenAI o3 在 AIME 2024 benchmark 能拿到 96.7% 這

bj45566 01/26 23:29種成績,任何知名的論文或報導都會說它數學好

mamorui 01/26 23:30但我是實務要使用,你可以掛保證我實務使用AI數學

mamorui 01/26 23:30沒問題嗎?

mamorui 01/26 23:30我才不管他們論文用的數據集,重點是我付錢的實務

mamorui 01/26 23:30者要用的時候沒出差錯

bj45566 01/26 23:31從來沒有人 -- 只有你 -- 對於「數學很好」的定義是

bj45566 01/26 23:31能解出世界上所有的高中數學題目!歡迎拿出和你持

bj45566 01/26 23:31相同標準的論文或科學報導後來打臉我

mamorui 01/26 23:32你忘了你第一篇吹OpenAI數學很好了 你要掛保證我

mamorui 01/26 23:32實用用問題才對

bj45566 01/26 23:34你實務上能找到任何來源確保解出所有的高中數學問題

bj45566 01/26 23:34嗎(-- 這個要求有什麼意義)?你的台大同事嗎?嘻嘻

bj45566 01/26 23:34 wwww wwww

mamorui 01/26 23:34我第一篇就說了 我覺得OpenAI數學沒很好 因為我實

mamorui 01/26 23:34務到現在就還是錯對皆有

mamorui 01/26 23:35所以我才說你不要堅持AI數學很好 不然就是誤導別人

bj45566 01/26 23:36懶的再和始終拿不出任何打臉資料的槓精無意義爭辯了

mamorui 01/26 23:37反正我隨便找一題正常幾何數學題就看到錯的答案,

mamorui 01/26 23:37還不是找上百題,AI數學很強再說啦

bj45566 01/26 23:38繼續吹噓一個沒有人能達到的超高標準然後沉溺於阿Q

bj45566 01/26 23:38 式的精神勝利吧 -- 科展佳作生 wwww wwww

mamorui 01/26 23:38那題明明就不難 @@

mamorui 01/26 23:39那題都難,你更難的運算敢給AI跑?

Goldx5 01/26 23:46原來是槓草,中又贏

bobogei8112301/26 23:46隨便測一題居然 o1 錯了 DeepSeek 對了…

bobogei8112301/26 23:46https://tinyurl.com/attj5d3x

bobogei8112301/26 23:47感覺o1想太多了 中間一度是對的 另一題都對就不貼了

bobogei8112301/26 23:47但當然啦 只有兩題沒什麼代表性

waylank1234 01/26 23:49感覺這個比較有可能美國科技業巨頭會支持川普的原

waylank1234 01/26 23:49因,因為他們要放開AI的監管制度

rrazer 01/26 23:54中又贏

Brioni 01/26 23:56DS只是CP最高,沒人說他最強吧

Brioni 01/26 23:56但成本一直都是市場在意的一環

bigtree03 01/26 23:56股點中又贏

justin20042801/27 00:01要騙補助啊?阿祖

shiki1988 01/27 00:13多觀察一下C洽就能知道是不是越來越多中吹

redbeanbread01/27 00:18

bella1815 01/27 00:40DS從12月多就一堆人出來喊,結果上證從3400多跌到

bella1815 01/27 00:40現在3200多,討論一下要買啥股吧,這股板耶

mango4132 01/27 08:33meta亂封號快還我帳號

fgkor123 01/27 09:15酣眠,現在就沒一個能保證國中數學不錯了

fgkor123 01/27 09:17研所槓精= =

Chilloutt 01/27 09:56靠蒸餾 每家都可以吧? 鏟子完惹

semicoma 01/27 10:35TaiwanUp你對LeCun的觀點解讀錯了

AirLee 01/27 10:44股價說明一切 fb創高啊