PTT推薦

[問卦] AI 理解能力比較

看板Gossiping標題[問卦] AI 理解能力比較作者
guest2008
(guest)
時間推噓 X 推:1 噓:2 →:5

題目如下,本題不在乎是否回答出正解,
只是要考驗 AI 識別能力跟知識廣度,
所以找網頁不存在答案,且專業性的考題


https://i.imgur.com/incb4yl.jpeg

圖 AI 理解能力比較

結論,四個AI 都能辨識出這個字串

DeepSeek
答案也是亂走,沒識別出字串


https://i.imgur.com/XpR2P8O.jpeg

圖 AI 理解能力比較


ChatGtp
不懂下棋規則,且盤面也是識別錯誤
https://i.imgur.com/eLdBR0N.jpeg

圖 AI 理解能力比較

Copilot
他左右顛倒了,回答 C2=6, 他是想答
炮七平四(C7=4),雖然他走大爛著,但至少他懂這個字串是什麼

https://i.imgur.com/2SVcEr9.jpeg

圖 AI 理解能力比較

Gemini
爛! 連位置都識別錯位,車在七不是六
https://i.imgur.com/5Ln6oQ1.jpeg
圖 AI 理解能力比較

正確解答
https://i.imgur.com/O9R0Ml6.jpeg
圖 AI 理解能力比較

以上字串轉換出來的盤面是上面這張圖,
正確解答是 車七退二,沒人答對


本次AI 智力跟知識測驗,得分是

Copilot >> DeepSeek > ChatGtp > Gemini

Copilot 完勝其他三個 AI, 最爛的依然是 Gemini 2.0




--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 42.73.143.144 (臺灣)
PTT 網址

TexasFlood 02/06 12:30四個都付費版再來比

abcdragon 02/06 12:30Gemini最強

SDuncan 02/06 12:36是付費版的嗎?

cisyong 02/06 12:38你PO完後再用一次

cisyong 02/06 12:39可怕是被你校正後的AI

SDuncan 02/06 12:45我用付費版的monica和gemini advanced,

SDuncan 02/06 12:45怎麼和你的結果不一樣?

jesiuty 02/06 15:20Gpt 你從來沒有打對過