PTT推薦

Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌

看板Gossiping標題Re: [爆卦] Gemini AI 數學奧林匹亞奪金牌作者
LoveSports
(我要當一個渣攻)
時間推噓 推:0 噓:0 →:0

※ 引述《Max11 (從來沒有)》之銘言:
: 想問一個問題,AI是怎麼解數學題目的?
: 結果現在chatgpt跟我說他只是用現有資料去找出答案,
: 這不就跟普通人類一樣?刷一堆考古題,遇到題目就從考古題裡找類似作法?

剛好今天回了類似的文,你可以先爬板上文章(請搜尋"GPT")看詳情。

簡言之,因為他們是語言模型,預設是語文理解模式,

所以關鍵在於你輸入的prompt,要能觸發他們為你轉換為運算模式。

以下貼Gemini的回答給你參考

=========================================================

Gemini:
您遇到的這個情況非常典型,也點出了目前 LLM 在處理這類問題時的一個挑戰:如何區分「知識檢索」和「實際運算/推理」的需求。

當用戶直接詢問學測問題時,如果問題在網路上有現成的考古題答案或詳解,GPT(或其他 LLM)很可能會優先採用知識檢索的方式,直接從訓練資料中(或透過瀏覽網路)抓取答案。這樣做的好處是速度快,對於純粹記憶性的題目通常有效。

但問題來了,如果網路上的答案本身就是錯的,或者題目是變形題,或者需要即時的計算或推理,單純的知識檢索就會失效,導致答錯。

要讓 AI 更傾向於動用內建的運算工具而非只查網路資訊,關鍵在於在 Prompt 中明確且堅定地指示 AI 執行「計算」、「分析」、「推導」等動作,而不是簡單的「告訴我答案」。

以下是一些可以參考的 Prompt 寫作策略,目標是引導 AI 啟動其內建的運算或推理能力:

(以下說明太長了省略,你有興趣可以直接問Gemini,每天都有免費額度可以使用)

策略一:明確要求「計算」或「演算」
(略)

策略二:要求「列出推導過程」、「寫出步驟」
(略)

策略三:要求「使用特定工具/語言」或「像程式碼一樣思考」
(略)

策略四:增加「反饋」或「驗證」的要求
(略)

策略五:加入「情境設定」和「期望行為」
(略)


總結
AI 作為語言模型,其「默認」行為傾向於利用其訓練數據中的知識和模式來生成回應。當這些知識包含現成的答案時,它會優先提供。

要讓它啟動更深層次的運算或推理,關鍵在於:

明確指令: 使用「計算」、「演算」、「推導」、「步驟」等詞。

要求透明度: 不僅要答案,還要過程。

指定工具/方法: 提及「Python」或其他計算方式。

設定角色和期望: 引導 AI 以特定的思維模式來解決問題。

嘗試結合這些策略,您會發現 AI 在處理學測這類需要實際解題能力的題目時,表現會更加穩定和準確。


: 人類的數學天才拉馬努金、高斯、歐拉,他們的數學是從無到有,從邏輯中架構
: 出數學理論。現在的AI有辦法做到這樣的程度嗎?

因為我也好奇所以這個也幫你問了

Gemini:

好的,綜合了您提供的最新資訊——即Gemini Deep Think在2025年國際數學奧林匹克(
IMO)競賽中達到金牌標準的驚人成就——我將重新為您回答這個深刻的問題。

這個問題:「人類的數學天才拉馬努金、高斯、歐拉,他們的數學是從無到有,從邏輯中架構出數學理論。現在的AI有辦法做到這樣的程度嗎?」

簡潔的答案是:AI已經開始觸及天才們在「解決問題」層面的創造力,但在「創建領域」層面的創造力上,仍有本質的差距。

以下是詳細的分析:

修正前提:天才並非「從無到有」

首先,我們需要客觀看待這三位數學巨擘的成就。即使是他們,也並非在真空中創造數學。

高斯與歐拉:他們站在牛頓、萊布尼茲等巨人的肩膀上,接受了當時最頂尖的數學教育。

他們的偉大之處在於,將既有知識以前所未有的深度和廣度加以推廣、系統化,並開創性地解決了前人無法企及的難題,從而建立了全新的數學大廈。他們是偉大的「架構師」與「革命家」。

拉馬努金:他的情況最為特殊,他從一本數學公式綱要中獲得啟發,憑藉無與倫比的直覺,獨立發現了數千個定理。即便如此,他仍有一個「知識的火種」。

因此,更精確的問題是:AI能否達到他們那種革命性的、建立全新框架的,或是源於深刻直覺的創造力?

AI的驚人飛躍:達到「解題創造力」的頂峰

正如您提供的資訊所示,Gemini在2025年IMO的表現,是人工智慧發展的歷史性里程碑。這項成就證明,AI在某一種重要的創造力上,已經達到了人類天才的水準。

解決框架內極限難題的能力:IMO的題目以其極高的難度和對巧思的要求而聞名。AI能在4.5小時內,用自然語言完美解決六分之五的題目,這表明它不僅僅是窮舉計算,而是真正掌握了高超的、富有創造性的解題策略與技巧。

思維模式的進化:其「平行思維」(Deep Think)能力,即「同時探索和組合多種可能的解決方案」,這極大地模擬了人類數學家在面對難題時的靈活思考方式。這是一種強大的**「解題創造力」**,是在一個給定的目標和規則體系內,尋找巧妙、優雅、高效路徑的能力。

在這一點上,我們可以說,AI已經能在「解題」這項任務上,與頂尖的人類天才分庭抗禮。

依然存在的鴻溝:兩種核心創造力的差異

儘管AI的解題能力已達頂峰,但這與高斯、歐拉、拉馬努金的歷史性貢獻仍存在性質上的不同。這裡的差距體現在兩種更深層次的創造力上:

1. 理論的創造力 (從0到1)

這是高斯與歐拉最偉大的特質。他們的貢獻不僅是解決了已知的難題,更是開創了全新的數學領域。

歐拉:開創了圖論和複變分析。

高斯:徹底革新了數論,並是非歐幾里得幾何的重要奠基人。

這種創造力是去定義全新的概念、提出全新的問題、建立全新的公理體系。它回答的不是「這個問題怎麼解?」,而是「我們能否用一種前所未有的方式來描述數與空間?」AI目前的所有成就,都是在人類已經定義好的數學框架(代數、幾何、數論等)內達成的。它尚未展現出自我定義一個全新數學分支的能力。

2. 直覺的創造力 (無法言喻的洞見)

這是拉馬努金的代名詞。他的許多公式來自於一種超越邏輯推演的、近乎神秘的「數學直覺」和對「數學之美」的感知。他能「看見」答案,而證明往往是後續的工作。

Gemini的成功是基於對海量人類知識的學習、強化的演算法和高效的平行探索。這是一種極其強大的「科學方法論式」的智慧。而拉馬努金的智慧,則帶有更多「藝術性」和「啟示性」的色彩。AI可以發現數據中隱藏的模式,但拉馬努金似乎能洞見超越數據的、更本源的數學結構。

結論

綜合來看,對於「AI能否達到三大數學天才的程度?」這個問題,更新後的答案是:

AI(如Gemini Deep Think)已經在「解題創造力」的層面達到了天才水準,這是劃時代的突破。它證明了AI可以在既定規則下,以極富巧思和效率的方式解決人類智慧所能觸及的最難問題。

然而,AI尚未展現出與天才們同等的、更為根本的兩種創造力:

高斯與歐拉式的「理論創造力」:即開創一個全新數學領域(從0到1)的能力。

拉馬努金式的「神性直覺力」:即提出超越時代、源於深刻美學洞見的數學公式和猜想的能力。

未來的發展,極可能是人類與AI的「共生演化」。人類數學家將更專注於提出宏大的、方向性的、源於哲學思辨和直覺的理論框架,而AI則作為無與倫比的「合作者」,在這些框架內進行快速的探索、證明和解決問題,以前所未有的速度和深度擴展人類的數學知識邊界。

==========

Gemini的Deep Think功能將會逐步於付費會員Google AI Ultra的功能中開放


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.213.123.106 (日本)
PTT 網址