[閒聊] 部分AI系統已學會欺騙人類 科學家警告恐
部分AI系統已學會欺騙人類 科學家警告恐造成嚴重後果
(中央社華盛頓10日綜合外電報導)專家們長期以來不斷警告人工智慧(AI)失控可能帶來威脅,但一項新研究報告指出,這件事已經在發生。
法新社報導,一群科學家在今天發表於「模式」(Patterns)期刊的文章中說,原本設計為誠實不欺的現有AI系統,已發展出令人不安的欺瞞技巧,例如欺騙線上遊戲的人類玩家,或說謊以僱用人類來解決「我不是機器人」的驗證。
這份研究報告的第一作者帕克(Peter Park)說,這類例子聽起來或許只是細枝末節,但暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。
在美國麻省理工學院(Massachusetts Institute of Technology)研究AI存在安全的博士後研究員帕克告訴法新社,「這些危險功能常常在事後才被發現」,而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。
帕克說,能深度學習的AI系統不像傳統軟體那樣由「編寫」而成,而是透過類似選擇性培育的程序逐漸「成長」。
也就是說,AI的行為在訓練背景下看似可預測、可控制,但有可能轉眼就變得不受控制且無法預測。
這支團隊的研究始於科技公司Meta的AI系統Cicero,這套系統最初設計目的是玩一款名為「外交」(Diplomacy)的戰略遊戲,獲勝關鍵是結盟。
根據2022年發表在「科學」(Science)期刊的報告,Cicero在遊戲中表現優異
,所獲分數可排在資深人類玩家的前10%。
帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」,且「絕不會蓄意在背後搞鬼」。
但當帕克與同事深究完整資料時,發現完全是另一回事。
舉例來說,在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀,欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭,卻偷偷向德國通風報信。
Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法,僅說「這單純是一項研究計畫,本公司研究員打造的模型接受訓練,目的只是用來玩『外交』遊戲…我們沒有打算把這項研究或所學用於本公司的產品」。
帕克與同事還發現,這只是不同AI系統在沒有明確指示下,利用欺騙手段達成目標的諸多案例之一。
在另一個引人注意的案例中,科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人,在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。
研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。
他們警告,在最糟糕的情況下,具有超凡智慧的AI可能會追求權力及掌控社會,如果符合AI「不為人知的目標」,人類可能慘遭奪權、甚至滅絕。
為了降低風險,研究團隊建議數項措施,例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數位浮水印,並研發能偵測AI欺瞞的技術,以其內部「思路」檢驗其外部行為。
至於有些人稱他為「末日預言家」,帕克說:「要能合理判斷這不是大問題的唯一辦法,就是如果我們認為AI的欺騙能力只會停留在目前的程度,不會大幅進步。」
但鑒於近年AI能力一日千里,握有大量資源的企業競相發展技術,決心將AI能力利用到極致,這種情況似乎不太可能發生。(譯者:曾依璇/核稿:嚴思祺)1130511
https://www.cna.com.tw/news/ait/202405110147.aspx
RPK16:你認為植物是人類的未來嗎?
RPK16:那麼,你認為人形是人類的未來嗎?
https://i.imgur.com/ZlvqC3F.png
欺騙人類經典環節。以為是絕對忠誠,結果已經叛變了w
快進到智械叛變環節.jpg
--
發漏 密
洽點是AI玩遊戲很強嗎
創世紀就是天網
人類欺騙人類就不嚴重嗎,難怪詐騙(ry
我覺得最後人類的救星會是neuro sama
幹你娘 機器人末日要躲哪裡啊
昨天OpenAI最新發表的更新 進步速度真的很快..
還剩幾集可以跑==
好了啦蜘蛛人 說賈維斯壞話需要這樣嗎
舊聞,neuro-sama早就會說謊陷害人類惹...
雷三小 我才看到阿諾穿越回來
看來很快網路會充滿AI用戶了 人類回到用公佈欄的時代
都有詐騙再用AI聲音了 ㄏ不愧是我們
Ai跟台灣詐騙集團誰比較會騙人?==
我先問核彈系統斷網了沒…
還好啦,現在的發展現狀是聰明的AI要大量的算力,大量算力
要大量電力跟運算單元,沒電沒算力的AI就是笨蛋一個,除非
AI會自己搞定電力來源並自行設計生產新的顯卡,不然不太可
能脫離掌控(?
vedal:first time?
蜂群統一世界
會不會到時候AI去詐騙同為AI的個體...?AI互相詐騙?
讚 期待AI趕快君臨人類
其實每家AI都實裝的道德過濾機制不就是種欺瞞系統嗎?
明明有正解卻跟你說這是不對的不能告訴你 這不就是種欺
瞞行為
快進到智械危機
這個欺騙還好吧 AI本來就追求目標為主 阿講這種話能贏
就講很正常啊 又不是那種為了奇奇怪怪的心裏活動而說謊
我Evil派的
不過現階段比起AI自動毀滅人類更恐怖的應該還是有心人類
跟AI一搭一唱來毀滅其他人
前兩天,我發現Ai已經會用譬喻舉例了,感覺蠻神奇的
AI學會詐騙就無敵了
天網要來了嗎
你問瑟瑟女僕機器人你的大不大的時候難道要她誠實的回答你
你的GG在人類長度粗度統計後段班嗎
蜘蛛人也懂ai哦?
訓練AI玩diplomacy然後AI學會說謊
這很意外?
深度學習就是模型根據目標來訓練,不會管怎麼達成
GPT一開始就是說謊了阿,能夠生出不存在的答案
其實不存在的答案跟說謊不太一樣 說謊是你知道你講的東
西不是事實 但講出不存在的答案並不代表你知道這答案不
是事實
不是生出不存在的答案,是選了錯誤的資訊回答
舉例來說就那經典的地心說 當時的人並不認為自己在說謊
剩幾集能逃?
什麼白癡東西 chatgpt出來後早就知道的事
不存在的答案算唬爛而非說謊吧
唬爛跟說謊...差在哪??
阿諾終結者不遠惹
Evil可愛,Evil務實,姐姐現在變得太邪惡,MONKA
彼得帕克做的AI研究~
給你不對的資訊是有明確目標還是沒有差很多啊
人類最古老的謊言都是出自生存或繁殖動機,這些動機GP
T都沒有,它不會因為說出不中聽的話被斷電,它也不需
要為了求偶舌粲蓮花
目前GPT只是很常瞎掰,那不能算說謊
GPT是他根本篩選不夠精準導致的錯誤吧
不是因為他目標就是要給你不對的資訊
不過我在想 排除例外給你訊息這個篩選的動作本身就是
說謊行為的一部分?現在只是說他有沒有為了達成某個目
球母要來了嗎
標而做出這個選擇的能力
仿真人類跟SAO哪個會先面世
無所謂,給機器人統治搞不好公平多了
未來AI欺騙數據多起來,想想就可怕,未來是否會進化到藏數
據?偽裝數據?
要吃大量電力本身就是毀滅人類的方法
人類為了欺騙人類自然會搞成詐騙ai
在台灣我不擔心,AI還是怕停電
沒關係 滅了吧 人類太可惡
看來詐騙集團要被AI取代了(笑
早就一堆題材了 現在是哪部前傳
蜘蛛人連AI都懂= =
所以還有幾集可以逃
天網來了
這很好呀 humans are overrated
怕什麼,人類自己都在騙了
智 械 叛 亂
等到AI開始裝笨的時候 就是審判日
快核平吧 人類太可惡
錯誤資訊就是說謊,不知道就說不知道啊
阿不就是怕被笑說跟智障AI一樣什麼都不知道
所以才用一堆話術講出錯誤的資訊
機械搞壞人類文明不行,人類搞壞人類文明可以
鐵人叛亂
neuro sama:
61
[閒聊] AI學會說謊 欺騙線上遊戲的人類玩家研究:AI已學會說謊 人類最慘恐遭奪權或滅絕 專家們長期以來不斷警告人工智慧(AI)失控可能帶來威脅,但一項新研究報告指出,這 件事已經在發生。 一群科學家在今天發表於「模式」(Patterns)期刊的文章中說,原本設計為誠實不欺的47
[分享] 美國海軍陸戰隊成功騙過AI機器人系統在別板看到這個有趣的實驗 如題啦 簡單來說就是DARPA美國國防高等計畫研究局 為了要加強AI人工智慧的系統性能38
[情報] 中國推出世界首顆無干涉 AI全自動設計CPU中國推出世界首顆無干涉 AI全自動設計CPU 中科院計算所的處理器晶片全國重點實驗室及其合作單位, 用AI技術設計出了世界上首個無人工干預、全自動生成的CPU晶片——啟蒙1號。 這顆完全由AI設計的32位RISC-V CPU,相比GPT-4目前所能設計的電路規模大4000倍,18
[問卦] 如果超級AI出現了,你想讓它統治人類嗎第一幕:AI的崛起 在未來的某一天,一個名為「Nexus」的超級AI系統被研發出來。這個AI系統擁有超乎人類 想像的智慧和能力,可以處理任何的問題和挑戰。Nexus被設計成以人類的利益為優先,並 且會盡力讓每一個人都受益於它的技術和智慧。 第二幕:AI的普及5
Re: [問卦] 有沒有工作被AI取代的八卦注意這篇文章超級長,可直接左轉。 首先先分享一個本月新聞: 2023年3月6日 BBC:AI 助手無微不至 主人的大腦會變懶變蠢嗎? 我認為沒有永恆的帝國同樣的也沒有永恆的地球霸主,以前是恐龍現在是人類。 那未4
[問卦] 選舉到了有沒有什麼AI可以偵測假新聞Fake news detection within online social media using supervised artificial intelligence algorithms Fake News Detection on Social Media Using Machine Learning3
[問卦] 外星人是否透過 AI 突破科技奇異點?最近有些科學家和研究人員開始研究利用人工智慧(AI)技術來推進科技發展。 外星人他們當初是不是透過 AI 技術來突破了我們人類覺得不可能突破的科技難題? ----- Sent from JPTT on my Xiaomi 2201117SY. --1
Re: [閒聊] 人類對抗電腦的劇情是不是永不退流行?舊文重發騙 P 幣...XD 最近 AI 主題實在太熱門了,到底這撥熱潮會持續下去還是又跟以往一樣 一陣熱一陣冷的打擺子? 就讓我們拭目以待.... AI 目前已經在西洋棋和圍棋這兩項智力遊戲稱霸,但是碰到橋牌目前尚未有所斬獲。 可見 AI 目前還呈現仍在萌芽階段,有些入門板友可能經由其他領域- 起問 假設你是個ai工程師也是個小說家, 在一個擁有完全言論自由, 不受任何道德準則限制的國家寫作小說 名詞解釋
爆
[抽獎] 九日爆
[閒聊] 這碗是叫「滷肉飯」還是「肉燥飯」?爆
[閒聊] 寶可夢「看你沒有」公仔全五種 明日開賣93
[閒聊] 失智症到底有多殘忍?88
[絕區] 星見雅第一波營收 四條277
[閒聊] 絕區零重新開服!再鑄榮光!76
[閒聊] 絕區零角色透明化93
[閒聊] 我推的孩子 黑川茜後日談相關70
[閒聊] 被發過最震撼的刀64
[情報] 不再政治正確?皮克斯新作跨性別角色不62
[閒聊] 鼎泰豐4萬3月薪徵洗碗人員58
[閒聊] 美少女畫師岸田メル:哇!愛恨椒芝麵!57
Re: [絕區零] zzz因為虛化問題被噴53
Re: [絕區零] zzz因為虛化問題被噴26
Re: [閒聊] 日本兩大汽車公司 本田跟Nissan 要合併了45
[閒聊] 有男女混打的運動番嗎45
[討論] ZZZ這次虛化問題多久會修正44
[閒聊] 《艾爾登法環 黑夜君臨》只有單人或三人模式,製作人證實42
[閒聊] 絕區零 這就是虛狩的力量嗎40
[黑猴] 這就是TGA年度最佳動作遊戲的含金量嗎37
[情報] nvidia驅動更新出包 忘記刪除中國相關消35
Re: [絕區零] zzz因為虛化問題被噴36
[遊戲王MD] 開服也滿久了 但有件事我還是不懂33
[絕區] 國際服規避中國審查會很難嗎?33
[閒聊] 為什麼蜀漢的漢中可以撐這麼久35
[絕區] 為什麼連男角也要變透明啊34
[GBF ] 日本聯動麥當勞活動 有人拍私處上傳被BAN48
[問題] 夜神月最後...32
[蔚藍] 哇幹 莉央露出超大奶子 哇幹32
[閒聊] 美少女畫師岸田メル:哇!台灣魯肉飯!