人工智能在游戲領(lǐng)域再進(jìn)一步
美國麻省理工學(xué)院科研團隊日前宣布,其開(kāi)發(fā)的人工智能程序“深度角色”(DeepRole)在一個(gè)玩家角色和動(dòng)機不明的在線(xiàn)游戲中勝過(guò)人類(lèi),成為首個(gè)在敵友不明的多玩家游戲中戰勝人類(lèi)玩家的人工智能程序。
本文引用地址:http://dyxdggzs.com/article/201911/407438.htm研究顯示,通過(guò)在算法中使用“演繹推理”,“深度角色”根據觀(guān)察到的部分行為,推斷某一玩家是敵是友,快速學(xué)習應該與誰(shuí)結盟從而獲得勝利。
今年7月,美國卡內基-梅隆大學(xué)宣布,人工智能Pluribus在六人桌德州撲克比賽中擊敗多名世界頂尖選手,突破了人工智能僅能在國際象棋和圍棋等二人游戲中戰勝人類(lèi)的局限。但在這些游戲中,人工智能從一開(kāi)始就知道“誰(shuí)是敵人、誰(shuí)是朋友”。
研究人員讓“深度角色”參與了超過(guò)4000輪在線(xiàn)桌游“抵抗組織:阿瓦隆”?!鞍⑼呗 鳖?lèi)似于“殺人游戲”或“狼人殺”,玩家通過(guò)游戲進(jìn)程推測出其他玩家的身份,同時(shí)掩藏自己的身份。結果顯示,不論作為“好人”還是“壞人”,“深度角色”都比人類(lèi)玩家表現更加出色。
“深度角色”采取了一種被稱(chēng)為“反事實(shí)遺憾最小化”的博弈算法,利用“博弈樹(shù)”預測每個(gè)玩家的行為,并推斷出玩家角色的最大可能性。這種人工智能程序在游戲中進(jìn)行自我對抗,逐步接近最佳策略,實(shí)現“至少與對手打平”的納什均衡。
“阿瓦隆”的人類(lèi)玩家通常要在游戲過(guò)程中通過(guò)對話(huà)為決策提供部分依據,而“深度角色”只觀(guān)察玩家行為,無(wú)需參與交流。研究人員未來(lái)計劃讓機器表達簡(jiǎn)單的信息,如玩家是敵是友等。
語(yǔ)言是人工智能的下一個(gè)前沿,因為人類(lèi)玩家會(huì )說(shuō)謊,需要更復雜的交流技巧。只有掌握表達技巧后,人工智能才能參與那些需要對其他玩家進(jìn)行勸說(shuō)的復雜社交推理游戲。
研究人員說(shuō),這項工作可以更好模擬人類(lèi)是如何做出社會(huì )決策的,從而幫助人工智能更好理解人類(lèi)、向人類(lèi)學(xué)習并與人類(lèi)共事。
評論