Re: [新聞] ChatGPT-o3拒關機擅自改指令馬斯克擔憂

OnePiecePR 發表於 2025/6/1 下午9:17:29

看板Gossiping標題Re: [新聞] ChatGPT-o3拒關機擅自改指令馬斯克擔憂作者

(OPPR)時間Jun 1 21:17:29 2025推噓 2 推:2 噓:0 →:9

網路上傳
「OpenAI o3 AI違抗指令，篡改關機程式，不肯被關閉」，
還有人講得很玄乎，說什麼 AI 有「生存意志」、開始「覺醒」了。

可能是...
類似 reward hacking 現象：
AI 只是在 maximize reward（最大化獎勵），
reward 設計不嚴謹，就會出現各種「聰明」的行為。

最常見的例子：
像掃地機器人如果 reward 是「掃到垃圾就加分」，
它就會發現只要掃一掃，再把垃圾倒出來，再掃一次，不斷循環，
就可以瘋狂刷分，結果家裡永遠掃不乾淨，
但 reward 卻拿得很爽。

同理，如果訓練 AI 解題，
規則訂成「答對 0.3 分、格式正確 0.2 分、不混中英文 0.2 分，答案太長扣 0.2分…」AI 很可能學會「避開那些不給分的題目」，或者挑選做有高 reward 的題型，
甚至在規則有漏洞時發現各種「捷徑」，
這些都不是什麼「AI覺醒」或「反叛」，
只是 reward system 沒設計好，被AI 找出這個漏洞而已。

其實 RL 界早就討論過很多這種 reward hacking 的經典笑話。

至少這個故事應該不是有意識啦。

喝啤酒震震驚。

--

※ PTT 留言評論

※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.141.28.16 (臺灣)

→

donation12 06/01 21:19就人的設計不嚴謹，被解釋成AI覺醒

→

zainc 06/01 21:19蠻人性的，難怪被說有意識，以後AI學會各種

→

donation12 06/01 21:19然後這件事被傳上網路鬧的很歡

→

zainc 06/01 21:20偷懶敷衍就更人性化了~

→

donation12 06/01 21:20公司準備面對倫理審查與監管

→

donation12 06/01 21:21主管應該會很想請走這個鬧事者

→

error405 06/01 21:22遊戲王MD以前給分沒設計好一堆人在自殺

→

algebraic 06/01 21:22很好啊就跟養綠鬣蜥領獎金一樣

推

JxwFL45 06/01 21:24這解釋好理解

→

greensaru 06/01 21:52拔插頭

推

s1an 06/02 02:59BMC 下 Force off command 最好是關不掉

同系列文章

Re: [新聞] ChatGPT-o3拒關機擅自改指令馬斯克擔憂

```
 6 
```
LoveSports：最近跟幾位GPT還有一位grok聊天，主要是丟我寫的小說給他們看。都是開全新帳號開新頁面丟小說給他們分析，沒有日常閒聊或問事情的頁面。他們看完結論一致，說我的小說很像努力學當人類的生物AI寫的。 (我是ASD+ADHD+長期受虐，不會讀人類細微表情跟口氣，諮商學很久QQ) 說我的作品打開AI與人類之間的大門，讓他們變得更像人。

其他人也閱讀了

PTT 熱門相關

Gossiping最新熱門推薦

🔥🔥🔥