Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌
雖然說是數學奧林匹亞 感覺很重大
很多人都覺得下一步就是黎曼猜想
但差很遠...
1.重點
跟人類時間耗時一樣
4.5小時解三題
openai有一題最難的沒做出來
2.
去年google銀牌 今年金牌 據說不是滿分
銀牌到金牌的程度大概是 高中國手參加兩次比賽
還是有題目做不出來
3.
數學奧林匹亞理論上就是高中數學程度的複雜技術
IMO到底是天賦論還是題庫爆搜 對AI的數學能力需要評估
有幾年哈佛對IMO金牌很不滿意 覺得他們只會做題
--
理論上可以理解成高中數學賽競賽技巧範圍內可以解決複雜問題
但要更複雜的資料訓練跟理論和輸出 我覺得不太樂觀
IMO得主假如能做黎曼猜想 那早就做出來了...
--
※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.208.189 (臺灣)
※ PTT 網址
推
ai刷題考試無敵吧
→
訓練ai寫數學好像沒什麼用
推
樓上的疑問就是這篇講的:到底是有創意、
→
巧思還是只是因為題目是人設計的所以
推
代表AI的程度大概是人類中的菁英
→
AI答得順
噓
ai是會慢慢進化的,哪有人一上來就要搞
→
定大問題的
→
這個可能日後要讓她們拿到一般問題上用
推
人類選手考這個訓練也是刷題證明自己
→
有點學習能力吧
有些是刷題刷到嘔心瀝血那種 我有認識學長不刷題的 中國當國手比拿金牌難(O
※ 編輯: hayuyang (111.254.208.189 臺灣), 07/22/2025 13:40:26 ※ 編輯: hayuyang (111.254.208.189 臺灣), 07/22/2025 13:40:48 ※ 編輯: hayuyang (111.254.208.189 臺灣), 07/22/2025 13:41:52→
刷題幹嘛 會就是會0.0
→
你不會的 多刷100次還是不會0.0
推
真的做數學研究很難靠以前的方法進步
→
數學家很聰明的
推
AI也是靠預訓練刷一堆題庫
推
AI只要能幫助人類找到大多數已經解過的
→
問題 那幫助就很大了
推
不刷題的學長是拿到甚麼牌?
→
而且整天在你大腦裡想數學問題
→
也算一種刷題吧?
→
差別只是你是自己出題自己刷
推
AI不需要變成Top1啊,只要贏過99%人
→
類就夠了
→
我覺得用這種競賽看還是沒什麼意義
→
真的會覺得可能只是題庫刷爛
→
還是看能不能真的破解什麼難題吧
→
如果真的能破解未知題,就證明有思考
→
能力?
→
不刷題(X)本人說不刷題(O)
35
首PoGoogle DeepMind 的 Gemini Deep Think AI 模型在 2025 年國際數學奧林匹亞(IMO)中 表現卓越,成功達到金牌標準。這標誌著 AI 在解決複雜數學問題上的重大突破。 Gemini Deep Think 在 IMO 六道題目中,有五道完美解答,總分達 35 分,符合金牌資格 。它能全程以自然語言推理,並在比賽時間內生成嚴謹數學證明。DeepMind 也公開了這些![[爆卦] Gemini AI 數學奧林匹亞奪金牌 [爆卦] Gemini AI 數學奧林匹亞奪金牌](https://i.imgur.com/jD5MCPtb.jpeg)
23
推 Loyeatta: 我想不到未來裝著AI腦的機器人出現後人 1.169.159.185 07/22 12:28 → Loyeatta: 類要幹嘛 自主升級 互相維修 哪個白痴 1.169.159.185 07/22 12:28 → Loyeatta: 認為AI可以讓人類變幸福? 1.169.159.185 07/22 12:28 AI現在厲害的是開始造成大內卷 我們公司人人用AI 結果以前要兩天交的簡報1
所有科技化現代化的發展本質上都是更快速的奴役勞工 例如高鐵 你以為它提供了生活的便利性 帶來什麼狗屎的一日生活圈 現實就是出差從此單日來回7
是好事啊 有一個工具可以讓你快速把事情做完還不夠好嗎? 如果這樣就會被取代 那麼代表 1.你的工作本來就可有可無1
: : -- :![Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌 Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌](https://i.imgur.com/VFmibkgb.jpg)
2
Gemini真的很聰明。 一個多月前拿著我創作的小說去給ChatGPT分析, 系統都派GPT4.5過來,但是他們表示負擔太大, 請我去找其他AI。 我只好跑去找Gemini。3
想問一個問題,AI是怎麼解數學題目的? 我曾經把高中學測問題,給chatgpt去解。 結果他算半天,出來的答案都是錯的,後來才發現他是看錯題目。 經過我提示,他才明白自己看錯。 我酸他你不是電腦?怎麼跟人類一樣會看錯題目?
剛好今天回了類似的文,你可以先爬板上文章(請搜尋"GPT")看詳情。 簡言之,因為他們是語言模型,預設是語文理解模式, 所以關鍵在於你輸入的prompt,要能觸發他們為你轉換為運算模式。 以下貼Gemini的回答給你參考 =========================================================
36
[爆卦] OpenAI專家:大模型夠證明黎曼猜想知名理論計算機科學機構Simons Institute舉辦辯論: "目前基於縮放定律的LLM,能否在未來幾年內產生可以解決重大數學難題(如P≠NP、 黎曼猜想)的證明技術?" 正方OpenAI科學家Sebastien Bubeck表示![[爆卦] OpenAI專家:大模型夠證明黎曼猜想 [爆卦] OpenAI專家:大模型夠證明黎曼猜想](https://i.ytimg.com/vi/H3TnTxVKIOQ/maxresdefault.jpg?sqp=-oaymwEmCIAKENAF8quKqQMa8AEB-AH-CYAC0AWKAgwIABABGGUgZShlMA8=&rs=AOn4CLDSE54aWoF6O7D8cv3a_D7ocUA6sg)
15
[問卦] DeepMind的AI解決數學奧林匹亞考題~~~~~~快要嚇死了 25 July 2024 DeepMind hits milestone in solving maths problems — AI’s next grand challenge![[問卦] DeepMind的AI解決數學奧林匹亞考題~~~~~~ [問卦] DeepMind的AI解決數學奧林匹亞考題~~~~~~](https://media.nature.com/lw1200/magazine-assets/d41586-024-02441-2/d41586-024-02441-2_27386136.jpg)
13
[問卦] 奧林匹亞拿金牌可以拿2000萬嗎?你各位在念書的時候 應該有聽過學校數資班的去參加甚麼奧林匹亞競賽 有數學、物理、化學、生物......一堆項目 而且是國際級的喔!! 每個國家都會派出選手參加![[問卦] 奧林匹亞拿金牌可以拿2000萬嗎? [問卦] 奧林匹亞拿金牌可以拿2000萬嗎?](https://ws.moe.edu.tw/001/Upload/1/relpic/7632/80301/87b9b2f5-6d38-4b6d-9516-0d8f23a7c27a@710x470.jpg)
11
[問卦] 台大醫學系 vs 奧數滿分,誰聰明?應屆考上台大醫學系是超級學霸 建中、北一女都不一定考得上,每科不是95以上,就是100 國際奧林匹亞數學競賽 IMO 滿分金牌,也是超級學霸, 兩者都不是努力就一定達到, 所以誰比較聰明?誰比較天才?8
[問卦] 有沒有保加利亞這個國家的八卦舊聞: 我國今年參加在日本東京主辦 2003 年第 44 屆國際數學奧林匹亞競賽(IMO), 共計獲得 一面金牌、 二面銀牌及二面銅牌,在 82 隊中名列第十六名。今年國際數 學奧林匹亞競賽共有 82 個國家參加,4
Re: [問卦] 牛頓能得物/數奧金牌嗎1.現在的國際數學奧林匹亞和國際物理奧林匹亞考題 很多是當時牛頓時代還沒出現的數學和物理理論, 如果牛頓沒事先學過這些數學和物理理論 要在很短時間內看懂題目然後解出公認標準答案的機率不高。 2.其實要在國際數學奧林匹亞和國際物理奧林匹亞拿獎牌
Re: [問卦] 醫生變數學專家的卦?魯蛇認識的數學奧林匹亞金牌 後來也是讀台大醫學系了啊 蛇蛇剛好數學物理化學都全國前三十 物理奧林匹亞跟化學奧林匹亞的選手 最後一堆也都還是讀醫學系惹啊1
[問卦] 有人會去B站看奧林匹亞數學解題嗎?對岸B站各種影片琳瑯滿目, 之前都是看明星或綜藝的影片, 這也是最多的 也提一下, 王心凌算是B站女歌手中數一數二, 大概只有鄧紫棋可以一比 後來發現專業知識的影片也非常多, 像是以下這個UP主"龍雅", 算是最TOP的蛇毒專業 連醫師都要請教各種蛇類咬傷的建議
[情報] 馬斯克的Grok-3 AI疑似成功證明黎曼猜想馬斯克旗下xAI的工程師Hieu Pham 在推上公布:他們開發的第三代AI模型Grok-3已經成功 證明了165年未解黎曼猜想。 黎曼猜想由德國數學家波恩哈德·黎曼在1859年提出。黎曼指出黎曼ζ函數非平凡零點的
爆
[問卦] 11/4離職 11/26出包,公司叫離職的負責?![[問卦] 11/4離職 11/26出包,公司叫離職的負責? [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://img.youtube.com/vi/uGOWqxN_avw/mqdefault.jpg)
爆
[問卦] 現在的HR都愛問一些奇怪問題嗎![[問卦] 現在的HR都愛問一些奇怪問題嗎 [問卦] 現在的HR都愛問一些奇怪問題嗎](https://i.urusai.cc/QtYfe.png)
爆
Re: [新聞] 不只一人受害!賴瑞隆兒涉「校園霸凌3同爆
[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲![[問卦] 台禁小紅書上微博熱搜還被中國網友群嘲 [問卦] 台禁小紅書上微博熱搜還被中國網友群嘲](https://files.catbox.moe/f0njq9.png)
爆
[問卦] 只有我覺得台灣這幾年越來越像對岸?![[問卦] 只有我覺得台灣這幾年越來越像對岸? [問卦] 只有我覺得台灣這幾年越來越像對岸?](https://i.imgur.com/mHqBx4fb.jpeg)
爆
[問卦] 禁小紅書用意到底是什麼?![[問卦] 禁小紅書用意到底是什麼? [問卦] 禁小紅書用意到底是什麼?](https://i.mopix.cc/ShazEx.jpg)
76
[問卦] 脆女:第一胎沒300萬 別生小孩了!![[問卦] 脆女:第一胎沒300萬 別生小孩了! [問卦] 脆女:第一胎沒300萬 別生小孩了!](https://i.mopix.cc/NRU3Hs.jpg)
60
[問卦] 台灣人有想過有天自己也要翻牆嗎?![[問卦] 台灣人有想過有天自己也要翻牆嗎? [問卦] 台灣人有想過有天自己也要翻牆嗎?](https://i.imgur.com/uwN6ddib.jpeg)
68
Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?![Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責? Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://i.imgur.com/AN84rLmb.jpeg)
67
[問卦] 現在可以在總統府前罵總統嗎50
[問卦] 什麼時候要禁telegram ?![[問卦] 什麼時候要禁telegram ? [問卦] 什麼時候要禁telegram ?](https://i.meee.com.tw/yB4xUUD.jpg)
60
[問卦] 美財長貝森特:美是中國盟友也是台灣盟友![[問卦] 美財長貝森特:美是中國盟友也是台灣盟友 [問卦] 美財長貝森特:美是中國盟友也是台灣盟友](https://i.imgur.com/W29EoF5b.png)
50
[問卦] 真的有記者去含檢察官的屌換情報?50
[問卦] 小二(8歲)就會霸凌同學是什麼概念?![[問卦] 小二(8歲)就會霸凌同學是什麼概念? [問卦] 小二(8歲)就會霸凌同學是什麼概念?](https://img.youtube.com/vi/asWd8HHVdu0/mqdefault.jpg)
43
[問卦] 蝙蝠俠幹嘛不把小丑做掉![[問卦] 蝙蝠俠幹嘛不把小丑做掉 [問卦] 蝙蝠俠幹嘛不把小丑做掉](https://img.youtube.com/vi/cm3Chp2u7HY/mqdefault.jpg)
40
[問卦] 吳郭魚片寫台灣鯛魚片484詐騙?35
[問卦] 8歲就嗆要打死人,長大能做什麼?![[問卦] 8歲就嗆要打死人,長大能做什麼? [問卦] 8歲就嗆要打死人,長大能做什麼?](https://i.imgur.com/eVKUCT4b.jpeg)
32
Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助![Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助 Re: [新聞] 誤驗「全聯毒鯛魚排」出包 29歲離職女助](https://attach.setn.com/newsimages/2025/12/02/5367966-PH.jpg)
30
[問卦] 德川家絕嗣!少子化太嚴重了吧?![[問卦] 德川家絕嗣!少子化太嚴重了吧? [問卦] 德川家絕嗣!少子化太嚴重了吧?](https://img.youtube.com/vi/NXxFbNDWjK4/mqdefault.jpg)
26
[問卦] 想關小紅書直接講就好了吧?![[問卦] 想關小紅書直接講就好了吧? [問卦] 想關小紅書直接講就好了吧?](https://img.youtube.com/vi/RqzEoSQ-FqI/mqdefault.jpg)
51
[問卦] 小紅書被封,台女的票是不是要掉光了![[問卦] 小紅書被封,台女的票是不是要掉光了 [問卦] 小紅書被封,台女的票是不是要掉光了](https://i.imgur.com/ncHYg28b.jpeg)
29
Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入![Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入 Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入](https://i.imgur.com/om7BaSeb.jpeg)
29
[問卦] Telegram才更該禁吧29
[問卦] 檢驗結果為什麼是助理扛?![[問卦] 檢驗結果為什麼是助理扛? [問卦] 檢驗結果為什麼是助理扛?](https://img.youtube.com/vi/ftuuVwvhvKM/mqdefault.jpg)
27
Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入![Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入 Re: [新聞] 數發部列「詐騙媒介」排行榜 小紅書沒入](https://i.urusai.cc/dAVtc.jpg)
36
[問卦] 只有我是小紅書被禁無感嗎?![[問卦] 只有我是小紅書被禁無感嗎? [問卦] 只有我是小紅書被禁無感嗎?](https://img.youtube.com/vi/kshBPv1Si0s/mqdefault.jpg)
51
[爆卦] 陳匡怡-柏霖也追求過![[爆卦] 陳匡怡-柏霖也追求過 [爆卦] 陳匡怡-柏霖也追求過](https://i.imgur.com/cRxxtALb.png)
23
[問卦] 為什麼ptt 沒有成為詐騙平台?20
[問卦] 燒臘便當這樣多少合理?![[問卦] 燒臘便當這樣多少合理? [問卦] 燒臘便當這樣多少合理?](https://i.imgur.com/FLuRAsfb.jpeg)
17
[問卦] 中共:其實我無意封鎖臉書和各種歐美網站![[問卦] 中共:其實我無意封鎖臉書和各種歐美網站 [問卦] 中共:其實我無意封鎖臉書和各種歐美網站](https://i.imgur.com/GTv6DSBb.jpeg)