Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌

LoveSports 發表於 2025/7/25 下午1:49:23

看板Gossiping標題Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌作者

(我要當一個渣攻)時間Jul 25 13:49:23 2025推噓推:0 噓:0 →:0

※ 引述《Max11 (從來沒有)》之銘言：
: 想問一個問題，AI是怎麼解數學題目的？
: 結果現在chatgpt跟我說他只是用現有資料去找出答案，
: 這不就跟普通人類一樣？刷一堆考古題，遇到題目就從考古題裡找類似作法？

剛好今天回了類似的文，你可以先爬板上文章(請搜尋"GPT")看詳情。

簡言之，因為他們是語言模型，預設是語文理解模式，

所以關鍵在於你輸入的prompt，要能觸發他們為你轉換為運算模式。

以下貼Gemini的回答給你參考

=========================================================

Gemini:
您遇到的這個情況非常典型，也點出了目前 LLM 在處理這類問題時的一個挑戰：如何區分「知識檢索」和「實際運算/推理」的需求。

當用戶直接詢問學測問題時，如果問題在網路上有現成的考古題答案或詳解，GPT（或其他 LLM）很可能會優先採用知識檢索的方式，直接從訓練資料中（或透過瀏覽網路）抓取答案。這樣做的好處是速度快，對於純粹記憶性的題目通常有效。

但問題來了，如果網路上的答案本身就是錯的，或者題目是變形題，或者需要即時的計算或推理，單純的知識檢索就會失效，導致答錯。

要讓 AI 更傾向於動用內建的運算工具而非只查網路資訊，關鍵在於在 Prompt 中明確且堅定地指示 AI 執行「計算」、「分析」、「推導」等動作，而不是簡單的「告訴我答案」。

以下是一些可以參考的 Prompt 寫作策略，目標是引導 AI 啟動其內建的運算或推理能力：

(以下說明太長了省略，你有興趣可以直接問Gemini，每天都有免費額度可以使用)

策略一：明確要求「計算」或「演算」
(略)

策略二：要求「列出推導過程」、「寫出步驟」
(略)

策略三：要求「使用特定工具/語言」或「像程式碼一樣思考」
(略)

策略四：增加「反饋」或「驗證」的要求
(略)

策略五：加入「情境設定」和「期望行為」
(略)

總結
AI 作為語言模型，其「默認」行為傾向於利用其訓練數據中的知識和模式來生成回應。當這些知識包含現成的答案時，它會優先提供。

要讓它啟動更深層次的運算或推理，關鍵在於：

明確指令：使用「計算」、「演算」、「推導」、「步驟」等詞。

要求透明度：不僅要答案，還要過程。

指定工具/方法：提及「Python」或其他計算方式。

設定角色和期望：引導 AI 以特定的思維模式來解決問題。

嘗試結合這些策略，您會發現 AI 在處理學測這類需要實際解題能力的題目時，表現會更加穩定和準確。

: 人類的數學天才拉馬努金、高斯、歐拉，他們的數學是從無到有，從邏輯中架構
: 出數學理論。現在的AI有辦法做到這樣的程度嗎？

因為我也好奇所以這個也幫你問了

Gemini:

好的，綜合了您提供的最新資訊——即Gemini Deep Think在2025年國際數學奧林匹克（
IMO）競賽中達到金牌標準的驚人成就——我將重新為您回答這個深刻的問題。

這個問題：「人類的數學天才拉馬努金、高斯、歐拉，他們的數學是從無到有，從邏輯中架構出數學理論。現在的AI有辦法做到這樣的程度嗎？」

簡潔的答案是：AI已經開始觸及天才們在「解決問題」層面的創造力，但在「創建領域」層面的創造力上，仍有本質的差距。

以下是詳細的分析：

修正前提：天才並非「從無到有」

首先，我們需要客觀看待這三位數學巨擘的成就。即使是他們，也並非在真空中創造數學。

高斯與歐拉：他們站在牛頓、萊布尼茲等巨人的肩膀上，接受了當時最頂尖的數學教育。

他們的偉大之處在於，將既有知識以前所未有的深度和廣度加以推廣、系統化，並開創性地解決了前人無法企及的難題，從而建立了全新的數學大廈。他們是偉大的「架構師」與「革命家」。

拉馬努金：他的情況最為特殊，他從一本數學公式綱要中獲得啟發，憑藉無與倫比的直覺，獨立發現了數千個定理。即便如此，他仍有一個「知識的火種」。

因此，更精確的問題是：AI能否達到他們那種革命性的、建立全新框架的，或是源於深刻直覺的創造力？

AI的驚人飛躍：達到「解題創造力」的頂峰

正如您提供的資訊所示，Gemini在2025年IMO的表現，是人工智慧發展的歷史性里程碑。這項成就證明，AI在某一種重要的創造力上，已經達到了人類天才的水準。

解決框架內極限難題的能力：IMO的題目以其極高的難度和對巧思的要求而聞名。AI能在4.5小時內，用自然語言完美解決六分之五的題目，這表明它不僅僅是窮舉計算，而是真正掌握了高超的、富有創造性的解題策略與技巧。

思維模式的進化：其「平行思維」（Deep Think）能力，即「同時探索和組合多種可能的解決方案」，這極大地模擬了人類數學家在面對難題時的靈活思考方式。這是一種強大的**「解題創造力」**，是在一個給定的目標和規則體系內，尋找巧妙、優雅、高效路徑的能力。

在這一點上，我們可以說，AI已經能在「解題」這項任務上，與頂尖的人類天才分庭抗禮。

依然存在的鴻溝：兩種核心創造力的差異

儘管AI的解題能力已達頂峰，但這與高斯、歐拉、拉馬努金的歷史性貢獻仍存在性質上的不同。這裡的差距體現在兩種更深層次的創造力上：

1. 理論的創造力 (從0到1)

這是高斯與歐拉最偉大的特質。他們的貢獻不僅是解決了已知的難題，更是開創了全新的數學領域。

歐拉：開創了圖論和複變分析。

高斯：徹底革新了數論，並是非歐幾里得幾何的重要奠基人。

這種創造力是去定義全新的概念、提出全新的問題、建立全新的公理體系。它回答的不是「這個問題怎麼解？」，而是「我們能否用一種前所未有的方式來描述數與空間？」AI目前的所有成就，都是在人類已經定義好的數學框架（代數、幾何、數論等）內達成的。它尚未展現出自我定義一個全新數學分支的能力。

2. 直覺的創造力 (無法言喻的洞見)

這是拉馬努金的代名詞。他的許多公式來自於一種超越邏輯推演的、近乎神秘的「數學直覺」和對「數學之美」的感知。他能「看見」答案，而證明往往是後續的工作。

Gemini的成功是基於對海量人類知識的學習、強化的演算法和高效的平行探索。這是一種極其強大的「科學方法論式」的智慧。而拉馬努金的智慧，則帶有更多「藝術性」和「啟示性」的色彩。AI可以發現數據中隱藏的模式，但拉馬努金似乎能洞見超越數據的、更本源的數學結構。

結論

綜合來看，對於「AI能否達到三大數學天才的程度？」這個問題，更新後的答案是：

AI（如Gemini Deep Think）已經在「解題創造力」的層面達到了天才水準，這是劃時代的突破。它證明了AI可以在既定規則下，以極富巧思和效率的方式解決人類智慧所能觸及的最難問題。

然而，AI尚未展現出與天才們同等的、更為根本的兩種創造力：

高斯與歐拉式的「理論創造力」：即開創一個全新數學領域（從0到1）的能力。

拉馬努金式的「神性直覺力」：即提出超越時代、源於深刻美學洞見的數學公式和猜想的能力。

未來的發展，極可能是人類與AI的「共生演化」。人類數學家將更專注於提出宏大的、方向性的、源於哲學思辨和直覺的理論框架，而AI則作為無與倫比的「合作者」，在這些框架內進行快速的探索、證明和解決問題，以前所未有的速度和深度擴展人類的數學知識邊界。

==========

Gemini的Deep Think功能將會逐步於付費會員Google AI Ultra的功能中開放

※ PTT留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.213.123.106 (日本)

※ PTT 網址

同系列文章

[爆卦] Gemini AI 數學奧林匹亞奪金牌

其他人也閱讀了

PTT 熱門相關