PTT推薦

Re: [閒聊] AI打星海爭霸,後來如何?

看板C_Chat標題Re: [閒聊] AI打星海爭霸,後來如何?作者
ephraim13825
(湊あくあ的クルー)
時間推噓11 推:11 噓:0 →:36

看到很多人都講到AI靠操作這件事

因為大學時期有稍微了解做過報告 而且以前對這遊戲還滿有熱情的

https://imgur.com/xmSgUU7.jpg

圖https://imgur.com/xmSgUU7.jpg, AI打星海爭霸,後來如何?

雖然實力不是最高 但還是講一點自己的看法好了


先貼上相關網站文件 有興趣可以看一下

研究簡介
https://reurl.cc/dWy2rk

Paper
https://reurl.cc/V1MDXQ


那時候的研發背景是 AlphaGo在稱霸圍棋後 deepmind想往更深的領域挑戰

所以想試試看如果今天是走法不固定的RTS AI會怎麼去判斷

當時還很多人覺得AI只能在有限制的範圍內贏人類 在這種多變又要有地圖觀的遊戲
內是無法比過人類的



一開始的版本就是前面看到的比賽版本

全視野(沒有迷霧都能看到) 280APM(有效操作) 350ms延遲 等等

所以當時有許多爭議

1.正常人只能看到你畫面中的物件

AI可以同時觀看到所有能見的區域 所以就能多線同時對應

所以在最後一場把視野關掉後 AI才不像以前可以同時做多線判斷

而且被搞到不知道該守哪邊輸掉

2.人往往會做出無意義的操作

雖然官方的APM是280 比一般選手都還要低很多

但是AI走的是一次到位的判斷 人類卻會有多餘的動作

例如我今天要控制單位從A到B AI會這樣走

https://imgur.com/L5W4Xqm.jpg

圖https://imgur.com/L5W4Xqm.jpg, AI打星海爭霸,後來如何?

但人類卻會是這樣走

https://imgur.com/nKg8zoC.jpg

圖https://imgur.com/nKg8zoC.jpg, AI打星海爭霸,後來如何?

同樣一個路徑上點好幾次慢慢往前 為了應付可能突然出現的意外

這樣造成明明是相同的判斷 普通人要比AI多花好幾倍的操作數去完成



因為開發者不一定懂遊戲 也不清楚實際的運作方式

所以在這次比賽結束後 deepmind重新思考了研究條件 並做出了幾個修改

只能對會面內的物件做判斷 且只能控制畫面內的單位

不只神族 而且三個種族同時進行訓練

與選手溝通 限制所有操作 反應時間 以至所呈現的結果都必須與人類相當


在修改完從新學習閉關修練後

https://reurl.cc/60dZWO

deepmind與暴雪合作 宣告會默默把AI投入進遊戲天梯對戰內 並隨機配對人類玩家

且會不斷換帳號 避免過多次來被發現是AI


結果在與人類同等的條件下 所有種族的AI都能爬到遊戲最高的宗師階級

且比遊戲內絕大部分的玩家強 這場AI對戰也就到這邊結束


結論就是就算是走法幾乎無限的RTS類遊戲 AI也能透過判斷來取勝

在這之後他們研究蛋白質應用在醫學領域又是另一個故事了


--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.254.39.62 (臺灣)
PTT 網址

bootes317708/30 18:56想到帥五進一

oldriver08/30 19:01投入魔獸世界 搞不好會比隨團隊友還強

stu19971208/30 19:03

rhox08/30 19:05我也有研究所同學做AI爬爐石天梯的研究

chejps310508/30 19:05我聽deepmind之前演講的說法是他們一開始用有戰爭迷

chejps310508/30 19:05霧發現訓練起來超爛,甚至連去找對手都不會,所以先

chejps310508/30 19:05全開訓練等到有階段性成果才把戰爭迷霧加回來。而不是

chejps310508/30 19:05他們不懂遊戲,他們內部工程師都有下去自己玩過

ephraim1382508/30 19:08我只的不懂是操作參數的部分

ephraim1382508/30 19:08他們可能認為280已經比絕大多數的選手低了 但不知道

ephraim1382508/30 19:08AI並不會有所謂的累贅動作 所以實際效果還是會被玩

ephraim1382508/30 19:08家強很多

doremon129308/30 19:09宗室是在那個服打的?

ephraim1382508/30 19:09*會比

henry123456208/30 19:09實際上280APM如果只是平均的也是沒啥用

ephraim1382508/30 19:09後面天梯都是歐服 官方還有說歡迎玩家來挑戰XD

henry123456208/30 19:09因為AI平常營運需要的APM比較少

henry123456208/30 19:09會戰的時候一樣有餘額可以飆到很高

ephraim1382508/30 19:10對 原本會戰會飆到1000 所以後面平均更最高都有調整

ephraim1382508/30 19:10到一般玩家水準

doremon129308/30 19:11AI操作不會失誤 小地圖不會漏看 就算一樣條件還是很

doremon129308/30 19:11有優勢

shasen123608/30 19:24以前我也追星海好幾年,但如果只是設這

shasen123608/30 19:24簡單限制和靠勝負得到這個結果,其實意

shasen123608/30 19:24義也不大

shasen123608/30 19:28AI最大的意義在於是否能幫人類想出更好

shasen123608/30 19:28的決策,只有這種簡單限制對於AI的操作

shasen123608/30 19:28根本沒差,重點在於結論有沒有得出什麼

shasen123608/30 19:28時候該多線,分多少兵,或者該不該換

shasen123608/30 19:28家,單純上宗師的AI應該打從星海上市第

shasen123608/30 19:28一天就能做了

ephraim1382508/30 19:28主要還是測AI在沒有固定落點的遊戲會怎麼走 算是比

ephraim1382508/30 19:28棋盤遊戲進步更大了

kira92508/30 19:31當時結論好像天梯爬到五千多還六千多分吧 再上去就沒了

kira92508/30 19:31但那個時候這遊戲也沒多少人了...

kira92508/30 19:32APM280印象中也不是真的平均 那次比賽有瞬間拉出1500

kira92508/30 19:33那個瞬間大家就知道整個訓練都歪了

teller52608/30 19:35不過不得不說打天梯跟番戰還是差蠻多的 天梯雙方都可

teller52608/30 19:35能不知道對方 但番戰就是雙方各種針對戰術

ephraim1382508/30 19:37平均280是因為平時只執行最低需求 不會像玩家一直瘋

ephraim1382508/30 19:37狂圈單位切畫面 所以很常在100左右 最高又不受限 才

ephraim1382508/30 19:37會不平衡 後續與選手討論調整成符合人類的標準

km85010508/30 20:16不過宗師也只是職業的等級而已

km85010508/30 20:17接近本作級的職業選手會有7000up的分

jjjj22208/30 21:09這個結果可以說明RTS主要就是打失誤的,

jjjj22208/30 21:09壓迫造成對手失誤, 誰失誤少誰就贏了

j14758908/31 04:59那個A到B 人類不能跟AI一樣點一次就好嗎