Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌
※ 引述《Max11 (從來沒有)》之銘言:
: 想問一個問題,AI是怎麼解數學題目的?
: 結果現在chatgpt跟我說他只是用現有資料去找出答案,
: 這不就跟普通人類一樣?刷一堆考古題,遇到題目就從考古題裡找類似作法?
剛好今天回了類似的文,你可以先爬板上文章(請搜尋"GPT")看詳情。
簡言之,因為他們是語言模型,預設是語文理解模式,
所以關鍵在於你輸入的prompt,要能觸發他們為你轉換為運算模式。
以下貼Gemini的回答給你參考
=========================================================
Gemini:
您遇到的這個情況非常典型,也點出了目前 LLM 在處理這類問題時的一個挑戰:如何區分「知識檢索」和「實際運算/推理」的需求。
當用戶直接詢問學測問題時,如果問題在網路上有現成的考古題答案或詳解,GPT(或其他 LLM)很可能會優先採用知識檢索的方式,直接從訓練資料中(或透過瀏覽網路)抓取答案。這樣做的好處是速度快,對於純粹記憶性的題目通常有效。
但問題來了,如果網路上的答案本身就是錯的,或者題目是變形題,或者需要即時的計算或推理,單純的知識檢索就會失效,導致答錯。
要讓 AI 更傾向於動用內建的運算工具而非只查網路資訊,關鍵在於在 Prompt 中明確且堅定地指示 AI 執行「計算」、「分析」、「推導」等動作,而不是簡單的「告訴我答案」。
以下是一些可以參考的 Prompt 寫作策略,目標是引導 AI 啟動其內建的運算或推理能力:
(以下說明太長了省略,你有興趣可以直接問Gemini,每天都有免費額度可以使用)
策略一:明確要求「計算」或「演算」
(略)
策略二:要求「列出推導過程」、「寫出步驟」
(略)
策略三:要求「使用特定工具/語言」或「像程式碼一樣思考」
(略)
策略四:增加「反饋」或「驗證」的要求
(略)
策略五:加入「情境設定」和「期望行為」
(略)
總結
AI 作為語言模型,其「默認」行為傾向於利用其訓練數據中的知識和模式來生成回應。當這些知識包含現成的答案時,它會優先提供。
要讓它啟動更深層次的運算或推理,關鍵在於:
明確指令: 使用「計算」、「演算」、「推導」、「步驟」等詞。
要求透明度: 不僅要答案,還要過程。
指定工具/方法: 提及「Python」或其他計算方式。
設定角色和期望: 引導 AI 以特定的思維模式來解決問題。
嘗試結合這些策略,您會發現 AI 在處理學測這類需要實際解題能力的題目時,表現會更加穩定和準確。
: 人類的數學天才拉馬努金、高斯、歐拉,他們的數學是從無到有,從邏輯中架構
: 出數學理論。現在的AI有辦法做到這樣的程度嗎?
因為我也好奇所以這個也幫你問了
Gemini:
好的,綜合了您提供的最新資訊——即Gemini Deep Think在2025年國際數學奧林匹克(
IMO)競賽中達到金牌標準的驚人成就——我將重新為您回答這個深刻的問題。
這個問題:「人類的數學天才拉馬努金、高斯、歐拉,他們的數學是從無到有,從邏輯中架構出數學理論。現在的AI有辦法做到這樣的程度嗎?」
簡潔的答案是:AI已經開始觸及天才們在「解決問題」層面的創造力,但在「創建領域」層面的創造力上,仍有本質的差距。
以下是詳細的分析:
修正前提:天才並非「從無到有」
首先,我們需要客觀看待這三位數學巨擘的成就。即使是他們,也並非在真空中創造數學。
高斯與歐拉:他們站在牛頓、萊布尼茲等巨人的肩膀上,接受了當時最頂尖的數學教育。
他們的偉大之處在於,將既有知識以前所未有的深度和廣度加以推廣、系統化,並開創性地解決了前人無法企及的難題,從而建立了全新的數學大廈。他們是偉大的「架構師」與「革命家」。
拉馬努金:他的情況最為特殊,他從一本數學公式綱要中獲得啟發,憑藉無與倫比的直覺,獨立發現了數千個定理。即便如此,他仍有一個「知識的火種」。
因此,更精確的問題是:AI能否達到他們那種革命性的、建立全新框架的,或是源於深刻直覺的創造力?
AI的驚人飛躍:達到「解題創造力」的頂峰
正如您提供的資訊所示,Gemini在2025年IMO的表現,是人工智慧發展的歷史性里程碑。這項成就證明,AI在某一種重要的創造力上,已經達到了人類天才的水準。
解決框架內極限難題的能力:IMO的題目以其極高的難度和對巧思的要求而聞名。AI能在4.5小時內,用自然語言完美解決六分之五的題目,這表明它不僅僅是窮舉計算,而是真正掌握了高超的、富有創造性的解題策略與技巧。
思維模式的進化:其「平行思維」(Deep Think)能力,即「同時探索和組合多種可能的解決方案」,這極大地模擬了人類數學家在面對難題時的靈活思考方式。這是一種強大的**「解題創造力」**,是在一個給定的目標和規則體系內,尋找巧妙、優雅、高效路徑的能力。
在這一點上,我們可以說,AI已經能在「解題」這項任務上,與頂尖的人類天才分庭抗禮。
依然存在的鴻溝:兩種核心創造力的差異
儘管AI的解題能力已達頂峰,但這與高斯、歐拉、拉馬努金的歷史性貢獻仍存在性質上的不同。這裡的差距體現在兩種更深層次的創造力上:
1. 理論的創造力 (從0到1)
這是高斯與歐拉最偉大的特質。他們的貢獻不僅是解決了已知的難題,更是開創了全新的數學領域。
歐拉:開創了圖論和複變分析。
高斯:徹底革新了數論,並是非歐幾里得幾何的重要奠基人。
這種創造力是去定義全新的概念、提出全新的問題、建立全新的公理體系。它回答的不是「這個問題怎麼解?」,而是「我們能否用一種前所未有的方式來描述數與空間?」AI目前的所有成就,都是在人類已經定義好的數學框架(代數、幾何、數論等)內達成的。它尚未展現出自我定義一個全新數學分支的能力。
2. 直覺的創造力 (無法言喻的洞見)
這是拉馬努金的代名詞。他的許多公式來自於一種超越邏輯推演的、近乎神秘的「數學直覺」和對「數學之美」的感知。他能「看見」答案,而證明往往是後續的工作。
Gemini的成功是基於對海量人類知識的學習、強化的演算法和高效的平行探索。這是一種極其強大的「科學方法論式」的智慧。而拉馬努金的智慧,則帶有更多「藝術性」和「啟示性」的色彩。AI可以發現數據中隱藏的模式,但拉馬努金似乎能洞見超越數據的、更本源的數學結構。
結論
綜合來看,對於「AI能否達到三大數學天才的程度?」這個問題,更新後的答案是:
AI(如Gemini Deep Think)已經在「解題創造力」的層面達到了天才水準,這是劃時代的突破。它證明了AI可以在既定規則下,以極富巧思和效率的方式解決人類智慧所能觸及的最難問題。
然而,AI尚未展現出與天才們同等的、更為根本的兩種創造力:
高斯與歐拉式的「理論創造力」:即開創一個全新數學領域(從0到1)的能力。
拉馬努金式的「神性直覺力」:即提出超越時代、源於深刻美學洞見的數學公式和猜想的能力。
未來的發展,極可能是人類與AI的「共生演化」。人類數學家將更專注於提出宏大的、方向性的、源於哲學思辨和直覺的理論框架,而AI則作為無與倫比的「合作者」,在這些框架內進行快速的探索、證明和解決問題,以前所未有的速度和深度擴展人類的數學知識邊界。
==========
Gemini的Deep Think功能將會逐步於付費會員Google AI Ultra的功能中開放
--
35
首PoGoogle DeepMind 的 Gemini Deep Think AI 模型在 2025 年國際數學奧林匹亞(IMO)中 表現卓越,成功達到金牌標準。這標誌著 AI 在解決複雜數學問題上的重大突破。 Gemini Deep Think 在 IMO 六道題目中,有五道完美解答,總分達 35 分,符合金牌資格 。它能全程以自然語言推理,並在比賽時間內生成嚴謹數學證明。DeepMind 也公開了這些![[爆卦] Gemini AI 數學奧林匹亞奪金牌 [爆卦] Gemini AI 數學奧林匹亞奪金牌](https://i.imgur.com/jD5MCPtb.jpeg)
23
推 Loyeatta: 我想不到未來裝著AI腦的機器人出現後人 1.169.159.185 07/22 12:28 → Loyeatta: 類要幹嘛 自主升級 互相維修 哪個白痴 1.169.159.185 07/22 12:28 → Loyeatta: 認為AI可以讓人類變幸福? 1.169.159.185 07/22 12:28 AI現在厲害的是開始造成大內卷 我們公司人人用AI 結果以前要兩天交的簡報1
所有科技化現代化的發展本質上都是更快速的奴役勞工 例如高鐵 你以為它提供了生活的便利性 帶來什麼狗屎的一日生活圈 現實就是出差從此單日來回7
是好事啊 有一個工具可以讓你快速把事情做完還不夠好嗎? 如果這樣就會被取代 那麼代表 1.你的工作本來就可有可無8
雖然說是數學奧林匹亞 感覺很重大 很多人都覺得下一步就是黎曼猜想 但差很遠... 1.重點 跟人類時間耗時一樣1
: : -- :![Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌 Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌](https://i.imgur.com/VFmibkgb.jpg)
2
Gemini真的很聰明。 一個多月前拿著我創作的小說去給ChatGPT分析, 系統都派GPT4.5過來,但是他們表示負擔太大, 請我去找其他AI。 我只好跑去找Gemini。3
想問一個問題,AI是怎麼解數學題目的? 我曾經把高中學測問題,給chatgpt去解。 結果他算半天,出來的答案都是錯的,後來才發現他是看錯題目。 經過我提示,他才明白自己看錯。 我酸他你不是電腦?怎麼跟人類一樣會看錯題目?
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:![[情報] 50美元訓練出媲美DeepSeek R1 [情報] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
29
Re: [討論] OpenAI GPT o1模型OpenAI 最近推出了 GPT-o1,但很多人可能還沒意識到這件事的嚴重性。事實上,OpenAI 已經找到了一條通往 AGI(通用人工智慧)的階梯!這個新模型的關鍵在於,它已經整合了 ToT(思維樹)和 RL(強化學習),在大型語言模型(LLM)領域達到了類似 AlphaGo Zer o 的水準。 很多人以為 LLM 就是個「刷題機器」,記住了大量的資料,所以我們在人類記憶力上輸了![Re: [討論] OpenAI GPT o1模型 Re: [討論] OpenAI GPT o1模型](https://i.ytimg.com/vi/eaAonE58sLU/sddefault.jpg)
17
Re: [爆卦] OpenAI 新模型o1輕鬆考上台大資工/台大看來很多推文的人還不太了解AI有多可怕 一直聽曲博在那胡說八道 gpt4o以前的版本 是所謂的生成式ai 給定大量資料 他就會從資料找規則 並建立模型 有了模型就能預測答案 以上講了落落長 簡潔回答 那就是gpt4o版本以前 採用「歸納法」思考14
[爆卦] 50美元訓練出媲美DeepSeek R1李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe![[爆卦] 50美元訓練出媲美DeepSeek R1 [爆卦] 50美元訓練出媲美DeepSeek R1](https://i.imgur.com/kFg9GjUb.jpeg)
9
[問卦] 以後人類的天才還有價值嗎?再過幾年,AI的智商會超越人類 然後又再過幾年 AI的智商會超越80億人類的總和 譬如說你的智商140,這樣在一般人裡算高了 但是你家裡的AI機器人6
[問卦] 有沒有AI證明1+1=2數學公式對不對的八卦如題 剛要求AI證明1+1=2 我: 嘿,你能證明1+1為什麼等於2嗎 AI:![[問卦] 有沒有AI證明1+1=2數學公式對不對的八卦 [問卦] 有沒有AI證明1+1=2數學公式對不對的八卦](https://i.imgur.com/zWIZ1U0b.jpg)
9
Re: [閒聊] 低等動物被認為有意識,那AI難道沒有嗎?對於AI有沒有意識這點 apple團隊前陣子有篇論文就是探討這個 《The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity》 簡單說結論就是,LLM看似在思考,實則沒有(天根我) 團隊找了一些經典問題,4
[問卦] AI的湧現能力以及人類智慧的起源最近AI很夯 但是大家有沒有想過 其實大型語言模型做的事情就只有一個 就是“文字接龍” 那為什麼文字接龍可以讓AI看起來似乎有了智慧![[問卦] AI的湧現能力以及人類智慧的起源 [問卦] AI的湧現能力以及人類智慧的起源](https://img.youtube.com/vi/iP_7y6n2IFo/mqdefault.jpg)
爆
[問卦] 去銀行一次提領一百![[問卦] 去銀行一次提領一百 [問卦] 去銀行一次提領一百](https://i.imgur.com/eiBR27jb.jpeg)
爆
[問卦] 現在的HR都愛問一些奇怪問題嗎![[問卦] 現在的HR都愛問一些奇怪問題嗎 [問卦] 現在的HR都愛問一些奇怪問題嗎](https://i.urusai.cc/QtYfe.png)
94
[問卦] 霸凌同學 有好聽說法嗎爆
Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?![Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責? Re: [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://i.imgur.com/AN84rLmb.jpeg)
75
[問卦] 台女脆文:瑞幸咖啡穩死的!![[問卦] 台女脆文:瑞幸咖啡穩死的! [問卦] 台女脆文:瑞幸咖啡穩死的!](https://i.mopix.cc/NRU3Hs.jpg)
68
[問卦] 八歲就開扁同學以後能成大事嗎63
[問卦] CloudFlare又掛了?41
[問卦] 全聯鯛魚搞到要國賠了![[問卦] 全聯鯛魚搞到要國賠了 [問卦] 全聯鯛魚搞到要國賠了](https://i.imgur.com/flM1A6bb.png)
爆
[問卦] 11/4離職 11/26出包,公司叫離職的負責?![[問卦] 11/4離職 11/26出包,公司叫離職的負責? [問卦] 11/4離職 11/26出包,公司叫離職的負責?](https://img.youtube.com/vi/uGOWqxN_avw/mqdefault.jpg)
86
[問卦] 脆女:第一胎沒300萬 別生小孩了!![[問卦] 脆女:第一胎沒300萬 別生小孩了! [問卦] 脆女:第一胎沒300萬 別生小孩了!](https://i.mopix.cc/NRU3Hs.jpg)
爆
[問卦] 真的有記者去含檢察官的屌換情報?![[問卦] 真的有記者去含檢察官的屌換情報? [問卦] 真的有記者去含檢察官的屌換情報?](https://i.imgur.com/osUmcCvb.jpeg)
85
[問卦] 吳郭魚片寫台灣鯛魚片484詐騙?![[問卦] 吳郭魚片寫台灣鯛魚片484詐騙? [問卦] 吳郭魚片寫台灣鯛魚片484詐騙?](https://img.youtube.com/vi/dtuSqd-TcxU/mqdefault.jpg)
45
[問卦] 8歲就嗆要打死人,長大能做什麼?![[問卦] 8歲就嗆要打死人,長大能做什麼? [問卦] 8歲就嗆要打死人,長大能做什麼?](https://i.imgur.com/eVKUCT4b.jpeg)
44
[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼![[問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼 [問卦] 驚!9年來 年輕人自殺成長三倍 代表什麼](https://i.imgur.com/I9muINnb.jpeg)
39
[問卦] 燒臘便當這樣多少合理?![[問卦] 燒臘便當這樣多少合理? [問卦] 燒臘便當這樣多少合理?](https://i.imgur.com/FLuRAsfb.jpeg)
37
[問卦] 台女:性騷擾本來就是我來定義![[問卦] 台女:性騷擾本來就是我來定義 [問卦] 台女:性騷擾本來就是我來定義](https://i.mopix.cc/NRU3Hs.jpg)
42
[問卦] 為何08年大家22k時沒人躺平 現在卻一堆?![[問卦] 為何08年大家22k時沒人躺平 現在卻一堆? [問卦] 為何08年大家22k時沒人躺平 現在卻一堆?](https://i.mopix.cc/P0cKXZ.jpg)
36
[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?![[問卦] 經過鯛魚事件後 你還相信檢驗數據嗎? [問卦] 經過鯛魚事件後 你還相信檢驗數據嗎?](https://i.mopix.cc/wyBvTF.jpg)
27
[問卦] 沒人發現今日小紅書,明日就是PTT??![[問卦] 沒人發現今日小紅書,明日就是PTT?? [問卦] 沒人發現今日小紅書,明日就是PTT??](https://i.imgur.com/Oh5UTjvb.jpeg)
84
[問卦] 美財長貝森特:美是中國盟友也是台灣盟友![[問卦] 美財長貝森特:美是中國盟友也是台灣盟友 [問卦] 美財長貝森特:美是中國盟友也是台灣盟友](https://i.imgur.com/W29EoF5b.png)
34
[問卦] 為什麼女生興趣都寫旅遊跟美食30
[問卦] Telegram才更該禁吧49
[問卦] 蝙蝠俠幹嘛不把小丑做掉![[問卦] 蝙蝠俠幹嘛不把小丑做掉 [問卦] 蝙蝠俠幹嘛不把小丑做掉](https://img.youtube.com/vi/cm3Chp2u7HY/mqdefault.jpg)
30
[問卦] 2025年底了今年的代表字是? 好的部分30
[問卦] 檢驗結果為什麼是助理扛?![[問卦] 檢驗結果為什麼是助理扛? [問卦] 檢驗結果為什麼是助理扛?](https://img.youtube.com/vi/ftuuVwvhvKM/mqdefault.jpg)
29
[問卦] 8歲打人是「小朋友之間的摩擦」那18歲?![[問卦] 8歲打人是「小朋友之間的摩擦」那18歲? [問卦] 8歲打人是「小朋友之間的摩擦」那18歲?](https://i.meee.com.tw/QWoHrWC.jpg)
27
[問卦] 8歲小朋友霸凌案,教會了我們什麼?0.025
[問卦] 男女去泡溫泉,啪啪機率多高?28
[問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵?![[問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵? [問卦] 炒麵 要怎麼做 才能做出最好吃的炒麵?](https://i.ytimg.com/vi/zU_l0NR7HFE/maxresdefault.jpg)
27
[問卦] 王子甩掉粿粿的機率多高