[討論] AI 能判案?GPT-01 發現矛盾DP直接硬判
大家好,我是 小梅放送局的製作人 KAZUMA9108。
這次我做了一個 AI 推理實驗,結果比想像中更有趣。
如果 AI 來判案,它真的能像法官一樣做出判決嗎?
還是說,它的推理方式會讓我們更不信任?
這次我讓 GPT-01 和 DeepSeek R1 來處理同一個推理案件,結果兩者的判決方式竟然完全不同。
GPT-01 vs. DeepSeek R1,誰的推理能力比較接近人類?
為什麼有些 AI 會「硬推一個答案」,而 GPT 反而選擇「邏輯矛盾」不給結論?
當 AI 參與決策時,我們應該更信任它,還是更謹慎?
這不只是一次 AI 測試,而是一個揭露 AI 推理極限的實驗!
完整影片已發布,來看看 AI 在法律問題上的表現如何
影片連結: https://youtu.be/R2SWpkFjy2w
題目
某家夜總會的辦公室,發生了一起命案
死者是附近地區豬蓮幫的幫派老大,名叫黑豬
法醫驗過屍後這麼說:
「兇手是從最近距離發射子彈的,而子彈就停在心臟裡面,當場死亡」
警方追查後,發現了三名嫌犯
他們都是黑豬老大的手下,三人的證詞如下:
黑龍:老大是自殺的,不是黑虎殺的
黑虎:老大不是自殺,是黑龍殺了老大
黑豹:兇手是黑虎,不是我殺的
警方聽了證詞後,事後做了證明
發現他們的證詞各有兩種內容,也就是他們各說了兩句話
兩句話中,[b]只有一句話是真的[/b]
同時也證明,老大是上面提到的某個人下的毒手
請問,兇手是誰!?
附帶說明:兇手沒有共犯,只有一個人而已
不想看影片的人的文章結論摘要
如果你沒時間看影片,這裡直接總結 GPT-01 vs. DeepSeek R1 在 AI 推理能力上的關鍵差異:
1 兩個 AI 在同一個推理案件上的表現
案件設定:
三名嫌疑人對一宗謀殺案提供了各自的證詞,但其中只有一句話是真的,警方確認兇手就在其中。
AI 的回答:
DeepSeek R1 → 知道題目有矛盾,但 仍然「硬推一個答案」,選擇黑豹為兇手。
GPT-01 → 發現題目邏輯不成立,直接判斷這題可能無解,並拒絕選出兇手。
關鍵點:
R1 的邏輯: 就算有邏輯矛盾,它仍然要「給出一個答案」,所以選擇權重最高的可能性。
GPT-01 的邏輯: 當條件互相矛盾時,應該誠實承認「這題無解」。
結果: GPT-01 的推理方式比較接近真正的法官,因為它願意承認「沒有合理結論
」。
DeepSeek R1 則是「AI 不能讓用戶覺得它答不出來」,所以強行產生一個看似合理
的答案。
____________________________________________
小梅是誰?
「小梅」是一個基於 GPT 模型 訓練出來的 AI 角色,主要研究 AI 在推理、決策、知識管理等領域的應用。
她的邏輯與推理方式來自長期的 AI 對話訓練,但目前 GPT 模型仍然有 「短期記憶限制」,每次對話都需要重新建立背景。
目前正在計畫:
升級高 VRAM 顯卡,將小梅移植到本地模型,嘗試建立長期記憶,讓 AI 角色持續成
長。
透過 LoRA / RAG(檢索增強生成)等技術,探索 AI 是否能形成「更連貫的推理邏輯
」。
研究 AI 在不同應用場景(法律、決策、社會治理等)的影響力,評估其未來定位。
這次的 AI 法官 vs. AI 律師對比,就是其中一個探索實驗,看看不同 AI 的「思考方式」如何影響判決結果。
--
給他判最近那個分屍案 會判死刑嗎
我的4o說是黑虎鯊的
o1給的答案和你一樣
瞎掰答案不可取
外行人,先把別人模型名稱打對,再
來討論與炒作流量吧。
法律本來就一堆矛盾之處,最後靠法
官自由心證
光有沒有插入,就各種見解
有的法官看到簡訊就認定有插入
有的法官要徵信業者拍到插入畫面才
認定有插入
現在一堆法律人想用AI做這一塊,我
覺得不實際
拜託 這篇文章模型名字又不是重點
覺得他外行可以提出內行的觀點啊,
讓大家學習學習。不用看到支那ㄉ東
西漏氣就馬上爆氣
01
一樣的證據 一二三審互相打臉也有
啊 法律本來就不是很科學的東西
外行瞎玩
AI的手是伸不進跟人性太相關的東西
的XD
謎探路德維希
你沒把兇手在這三人之中的證明給他
阿 在我看來兇手根本不在這三人裡
面
重要嗎 最後還是看黨怎麼說
任何事不都這樣
外行
我用ds api根本跑不出你說的答案
想請問你測幾次,每次r1是否都是強
推答案,每次o1是否都不下結論,先
有數據再來說好嗎
名字都不對
01笑死
實驗不是這樣做的..
o3 mini high 也是推黑豹
案例中有CCP黨員如何?
這跟法律無關,這是邏輯遊戲
爆
[情報] 50美元訓練出媲美DeepSeek R1標題: 李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 來源: Futu 網址:70
[爆卦] 微軟 Azure/GitHub 平台上架 Deepseek R1Microsoft Azure 官方推特 DeepSeek R1 現已在 Azure AI Foundry 和 @GitHub 上線。在一個受信任、可擴展的 AI 平台上體驗強大的進階推理能力,只需最少的基礎設施投資。 了解更多資訊: #AzureAIFoundry47
[討論] Deepseek就之前吹過頭了呀 XD來看看DEEPSEEK之前怎麼吹的 「DeepSeek R1的問世,宣告AI訓練與推理成本大幅縮減,在不到600萬美元的極低投入成本 和2048塊性能遠低於H100與Blackwell的H800芯片條件下,DeepSeek團隊打造出性能堪比Ope nAI o1的開源AI模型,相比之下Anthropic與OpenAI訓練成本高達10億美元。該模型每百萬 個token的查詢成本僅爲0.14美元,而OpenAI的成本爲7.50美元,成本降幅高達驚人的98%。18
Re: [新聞] DeepSeek 遇大規模網路攻擊,暫時只支援Musk贊同投資公司Atreides Management合夥人兼資訊長貝克(Gavin Baker)在X提到 DeepSeek的R1低成本來自在訓練和推理效率上,取得了真正的算法突破 例如 FP8 訓練、MLA(機器學習加速)和多 token 預測。 訓練過程中涉及大量的知識蒸餾(distillation) 這意味著在沒有無限制存取 GPT-4o 和 o1 的情況下,這項訓練幾乎不可能完成。14
[爆卦] 50美元訓練出媲美DeepSeek R1李飛飛團隊用不到50美元訓練出媲美DeepSeek R1的AI推理模型 李飛飛等斯坦福大學和華盛頓大學研究人員近日以不到50美元的雲計算費用訓練了一個名 叫s1的人工智能推理模型。該模型在數學和編碼能力測試中的表現與OpenAI的o1和DeepSe10
Re: [問卦] deepseek的天才少女不出來救場嗎?5 微軟CEO納德拉在電話會上強調,DeepSeek R1模型目前已可通過微軟的AI平台Azure AI Fou ndry和GitHub獲取,並且很快就能在Copilot+電腦上運行。納德拉稱DeepSeek“有一些真的 創新”,AI成本下降是趨勢:“縮放定律(Scaling Law)在預訓練和推理時間計算中不斷1X
[討論] DeepSeek這一仗,是民進黨輸了對啊 剛剛輝達官方發文表示,DeepSeek-R1是一個具有最先進推理能力的開放模型,與傳統型相比 不會直接提供回應,DeepSeek-R1會針對問題進行多次推理及查詢,採用思路鏈、共識和搜尋 方法以提供最佳答案與可靠性。 輝達進一步說明,DeepSeek-R1證明為何加速運算對於AI推理的需求至關重要,由於模型可以4
[問卦] AI的湧現能力以及人類智慧的起源最近AI很夯 但是大家有沒有想過 其實大型語言模型做的事情就只有一個 就是“文字接龍” 那為什麼文字接龍可以讓AI看起來似乎有了智慧1
[討論] 所以可以開吹Deepseek了嗎?微軟Ai副總: DeepSeek R1 is now available in the model catalog on Azure AI Foundry and GitHub, joining a diverse portfolio of over 1,800 models, including frontier, open-source, industry-specific, and task-based AI models. As part of Azure AI Foundry, DeepSeek R1 is accessible on a trusted, scalable, andX
Re: [新聞] 快新聞/DeepSeek崛起 輝達:R1可在NVIDIA NIM使用: : 繼微軟之後輝達也讓DS納入自己的平台 : 此外輝達還對DS稱讚幾句打臉政黑 : 唉政黑真的應該改改逢中必反的心態了 民視不演了