[閒聊] 5萬小時訓練AI玩寶可夢紅版 走不出月見山
https://game.udn.com/game/story/122089/7526108
在經歷長達 5 萬小時的訓練與學習後,
一位工程師成功讓一套 AI 模組學會如何遊玩《寶可夢:紅版》,
創造出能夠自行探索遊戲,組成寶可夢隊伍...。
...
由於機器演算法在本質上並不在乎「全破」一款遊戲,
因此 Whidden 為 AI 演算法設計一套在完成特定目標時能夠獲得獎勵的系統。
為了鼓勵 AI 在《寶可夢:紅版》中進行探索,
只要能夠在地圖上看到一些之前沒有看過的東西,就能夠獲得獎勵點數。
最終 AI 順利從真心鎮出發,穿過常盤森林,來到深灰市挑戰第一道館。
在那之前,AI 還需要更加完善的獎懲系統。
在學會看到新事物能夠獲得獎勵後,雖然 AI 會開始不斷向前邁進,
但完全不在乎收服寶可夢或進行對戰,而是在遇到野生寶可夢時立刻逃走。
因此,Whidden 為獎勵系統加入更多內容,
依照 AI 寶可夢隊伍的等級總和給予獎勵,讓它開始有動力去練等和捕捉寶可夢。
只不過在某一次的演算中,AI 走進寶可夢中心時意外開啟 PC,並在其中存放幾隻寶可夢。
由於 AI 獲得的獎勵點數是依照隊伍等級總和而定,這個行為導致 AI 獲得的分數瞬間驟降。
為了避免重蹈覆轍,AI 在那之後的所有演算中都選擇避開寶可夢中心,
完全不敢進去為寶可夢補血,這讓 Whidden 不得不再次插手調整。
這套 AI 演算法最基本的運作方式,其實就是隨機在《寶可夢:紅版》中走動與遊戲進行互動,
直到發現能夠以最有效率的方式獲得最多獎勵的路徑,並將經驗保留到下一次的演算中。
在挑戰的過程中,AI 都只會使用最基本的攻擊招式撞擊來進行對戰,
直到該招式的 PP 用完後才會使用其他選擇。
某次演算中,AI 終於發現傑泥龜的泡沫攻擊能夠對小剛的寶可夢造成大量的傷害,
最終順利擊敗這位道館館主。
即使 AI 在對於遊戲的理解與邏輯上依然比不上人類,但這場實驗發掘了一些更加深層的細節。
根據 Whidden 的發現,
AI 在經歷一段時間的演算後就開始固定以看似不尋常的路徑從真心鎮出發,直到遇到第一隻野生寶可夢。
然而,這一系列的操作其實能夠保證 AI 能夠一球抓到遇見第一隻寶可夢。
也就是說,AI 發現一個 Speedrun 玩家可能要花上好幾年的時間研究才有機會注意到的系統漏洞。
這套 AI 演算法在成功突破第一道館時基本上已經達成了 Whidden 最初設定的目標,
但 Whidden 決定要讓 AI 的《寶可夢:紅版》冒險繼續下去,
看看目前的獎勵機制到底能讓它走多遠。
可惜的是,第一和第二道館之間的月見山對於看到新事物就能加分的 AI 來說
實在是太過於容易分心,
因此一直到 Whidden 決定讓實驗告一段落前都無法順利抵達華藍市。
除此之外,AI 似乎非常喜歡從鯉魚王大叔手中購買鯉魚王,
因為這樣的行為能夠讓 AI 寶可夢隊伍的等級總和立刻多出五等,
因此到實驗結束前,AI 在其中 1 萬次的演算中都跑去買了鯉魚王。
另外值得注意的是,AI 有一次將抓來的小拉達命名為了「AI」,讓人細思極恐。
https://youtu.be/DcYLT37ImBY?si=Yc6mnic1FdBh3zw9
-----
1. 只要能夠在地圖上看到新東西,就能夠獲得獎勵點數
--> ai只會拼命往前衝,完全不打怪不練等
2. 依照 AI 寶可夢隊伍的等級總和給予獎勵
--> 不敢進寶可夢中心 以免把寶可夢存入電腦中、
一萬次演算都跑去買鯉魚王 因為直接加五等XD
3.月見山過多新事物 AI無法專心 中止實驗
--
耶穌鳥屌打
發現一發必中BUG有點恐怖
有台灣Yt 疑似未授權的搬運
一群猴子>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>AI
好酷
看來對AI來說寶可夢暫時還太難懂了一點
TPP>>>>>>>AI
鯉魚王大叔或成最大贏家
這意思是還不如金魚嗎
金魚>>>AI
滿酷的
結論 多了獎勵導向的硬A怪而已
笑死
AI:我要皮皮!我要月見石1
寶可夢其實很複雜耶 別看屬性相剋那樣 其實裡面學問超多
獎勵應該是館主 四天王 冠軍吧
一般小孩理解的第一遊戲目標
AI取AI的名字XD
沒問題啦 12萬支猴子都能TPP破關了 相信AI
人類:AI會毀滅世界!!
金魚:Hold my beer.
要算也是先算全破SR的玩法吧 寶可夢應該沒啥AI才能做到
的操作
等AI可以把小拉達變成夢幻再叫我
我小時候也都會去買鯉魚王
用無限船票砍樹!
鯉魚王真愛
好可愛又好恐怖XDDD
以破關為目標可能就變成各種卡BUG了
小時候這裡也走超久的
金魚腦>AI
給夠多時間猴子也能寫出莎士比亞
圖奇聊天室>AI
AI: 嗚嗚嗚,寶可夢中心把我的寶可夢吃掉了,以後不來了
AI:我在享受遊戲,為什麼要逼我走出鎮子 AI:靠背 打
怪會扣血 白痴才打
被存電腦嚇到不敢進去補血也太可愛
過個10年是不是要說AI玩的比你好
AI最大問題就是獎勵機制寫不好,只定一個最終目標沒啥用
能夠發現以前必抓bug還蠻厲害的
AI居然比猴子還弱
其實就很像三歲小孩玩的感覺
這個就你獎勵式沒寫好 獎勵式矛盾下的建模問題
要造出像人類一樣的AI 沒那麼簡單
能抓到亂數種子滿厲害的耶
AI沒有寫入打怪自己會變強的邏輯吧
這個就獎勵模式沒寫好而已 不會有人覺得“AI”只有一種吧
有人智商比猴子低 不代表人類智商比猴子低
用地圖探索和隊伍等級當獎勵條件訓練 就不夠聰明 直接
暴力寫一堆判斷條件進去一定能破關
不然至少要加前幾步當條件 否則走迷宮會一直原地繞圈
比圖奇猴子還不如
阿這個AI就比猴子弱阿
五萬個小時連小學生都不知道破關幾次了
這什麼鯉魚王鐵粉www
太猛了
看來還是當年一群人隨機的比較好玩
現在還只是人工智障而已,還在靠人為給權重,沒辦法
有自己的判斷能力
金魚的勝利
猴子都比較強
厲害了,我連常盤森林都走不出去。
感覺這AI只是單純接受指令(獎勵)去做事的社畜(X)而已
不敢進寶可夢中心還滿可愛的XD
不像是在玩PM遊戲 而是在玩指令給的獎勵要素
就很濃的作業感
所以這個AI能否通關 純粹看作者能否設計出完美的獎勵機制
然而作者很明顯做不到 才會導致AI為了獎勵去做不該做的事
我也喜歡和大叔買鯉魚王 然後在月見山練到進化
這AI說穿了就是一套演算法 是以影像辨識為基礎 發現
新畫面就會獎勵與紀錄起來 人腦是好幾套不同的演算
法 不懂不用瞎噴耶
想當初小時候卡在喝酒的老人……AI比較強
手寫獎勵函數有太多可能性要判斷 複雜的場景不可能這樣作
結合時事把手刻規則改用LLM判斷 雖然慢但說不定會好很多
AI社畜,5萬小時=6年
好酷的試驗
金魚屌打
鯉魚王笑死
這影片有趣的點在觀察獎勵機制造成ai訓練的傾向性 還有
嘗試修改的思路
作者想的不夠充分或故意想的不充分看會導致什麼策略
行為
有趣
我也會買耶xD
裡面有提到,他找出不遇敵路線,這還蠻厲害的耶
玩遊戲主要是樂趣啊~
這人超猛,才幾天觀看次數很高,而且有放開源碼
一發必中應該不是bug吧 比較像是遊戲用固定亂數表算機率
變因是步數之類的
他裡面有說用租的伺服器算力去跑 可以快1000倍
以跑40次2小時的遊戲來說 只需要6分鐘 他跑了750輪
750*2*40=60000小時 租伺服器去算大概只要62.5小時
伺服器租一天大約是50美金 他整個花了約1000美金
44
[閒聊] 贏了!人比AI會猜寶可夢!剛剛在跟隔壁同事聊天,他說前陣子教了一門課,學生的作品實在很有趣 題目是說寶可夢越出長得越奇怪,有沒有方法一眼就看出屬性 首先找了一群朋友,最準那位也只能到六成準確率X
[閒聊] 寶可夢很多人只學攻擊招式?如題 小弟發現很多人玩寶可夢 都是只學攻擊招式 劍舞?不會 詭計?沒聽過27
[閒聊] 寶可夢朱紫 博士根本機掰人(雷)一週目雷 玩的是紫版所以是弗圖博士 有些圖玩的時候沒截到 所以用實況主的畫面 在搭電梯的時候可以從AI那裡得知25
[閒聊] 以後寶可夢可以全部給AI設計了嗎如題 寶可夢越出越多 已經快要沒梗了 有時候畫個茶壺就說他是寶可夢 然而AI繪圖已經發達 可以生出無限種有趣的怪物圖片 以後是不是可以讓AI取代寶可夢設計師的工作 讓AI來設計新寶可夢 新進化 新神獸?20
[討論] 單刷6星太晶團體戰 AI隊友如題 邊緣人剛玩沒多久 目前主要靠鐵臂膀單刷9成洞 有稍微爬文 但沒看到相關討論單刷的ai隊友 我每次刷6星的ai隊友都一樣9
[閒聊] 輸入名稱 AI自動生成寶可夢大家晚安~吃飽了嗎 剛剛滑ig 的時候發現了這麼一個網站,只要你輸入名字,他就會用我不知道怎麼演算的 演算法幫你自動生成一隻寶可夢,於是我就用了幾個V的名字下去讓他算 Sakura miko6
[朱紫] 為什麼弗圖不先繳械自己?弗圖AI好歹是最新科技 開打前還先提醒關掉機器可能會讓自己與主角敵對 那為什麼關掉機器前不先把自己身上的寶可夢全都交給對方 不把鎖定寶可球的功能破壞掉 搞得最後主角還得靠偽神獸+吃藥才撐過去6
[問卦] 寶可夢劇情要怎麼順應時代?小智退休了 一個時代結束了 新一季的寶可夢劇情應該要更貼近時代 我想到的有: 寶可夢圖鑑內建抖音4
[閒聊] DeepMind能訓練出最強寶可夢VGC隊伍嗎當然先決條件是規則需要固定 不過寶可夢VGC已經進行很多年了 雖然環境會因為新世代/新系統有所改變 但規則大致上都很固定了,像是封面獸只能帶兩隻 規則上的穩定度應該足夠了3
Re: [問題] 我怎麼不記得草系有那麼爛啊龜龜是強在有地震 有地震的普遍怕水怕草 龜龜沒這個問題 但缺點就是冰4倍 打AI應該還好,打玩家就很尷尬
爆
[閒聊] 車輪餅你是紅豆派還是奶油派?☺爆
[閒聊] 黑白妹2 DLC steam版破10萬爆
[推投] 嘆息/嘆氣的亡靈想隱退 最喜歡女角「1票」92
[閒聊] 寶可夢:我是誰?84
[閒聊] 對史丹利的印象是什麼?82
[閒聊] 日本營養午餐的牛奶政策為什麼能成功73
Re: [閒聊] 車輪餅你是紅豆派還是奶油派?☺66
[問題] 哪部鋼彈動畫最鬼扯?63
Re: [閒聊] 川普當選會減緩DEI浪潮的狂奔嗎?59
Re: [閒聊] 川普:美國只有兩種性別 禁止男參加女賽59
[蔚藍] 學生介紹 生塩ノア (睡衣)54
[閒聊] 人龍0是人龍系列劇情的最高峰嗎?51
[閒聊] 鳴潮汐汐的SKIN也太佛了吧...爆
Re: [閒聊] 史丹利是不是真的很恨統神?48
[獵人] 可以用"嵌合蟻不是人類"來為小傑辯駁嗎?47
Re: [閒聊] 史丹利是不是真的很恨統神?47
[閒聊] 有不少明治時期的作品卻很少清末的?34
[閒聊] 科技越來越進步為啥遊戲開發時長越久?44
Re: [閒聊] 對史丹利的印象是什麼?38
[閒聊] 西園寺世界真的有懷孕嗎38
[一番賞] 鋼彈武鬥G 超級覇王電影弾 扇風機37
[妮姬] 官方美術 cos 水晶公主36
[索尼] 歷史上的今天:女神戰記初代發售35
[妮姬]哇幹 親媽畫聖誕”禮物”裝阿妮斯35
[問題] MGEX 攻自素組OK嗎??33
[活俠] 作品出周邊,原作者還要自己買會是常態嗎31
[閒聊] 帕魯v0.4.11更新內容32
[蔚藍] 天童愛麗絲 廣播劇情雷 大家的女兒29
Re: [閒聊] 車輪餅你是紅豆派還是奶油派?☺30
[24秋] 嘆氣的亡靈13 渣男克萊