资讯
首页  >  专题  >  环球科学  >  环球科学<前沿资讯>

人工智能打败《星际争霸II》欧服高端玩家

来源:环球科学

《星际争霸》游戏截图(图片来源:暴雪游戏官网)
这个夏天,科幻电子竞技游戏《星际争霸II》的玩家遭遇了一个非同寻常的对手——AlphaStar。人工智能AlphaStar由谷歌的人工智能公司DeepMind开发,于《星际争霸II》欧洲服务器上线,之后登上宗师(Grandmaster)段位,排在该地区九万名玩家中的前0.15%。
这一项结果发表于《自然》(Nature)杂志。该研究显示,人工智能可以在《星际争霸II》里与最高水平的玩家较量。《星际争霸II》是一个非常流行的网络策略游戏。玩家们在游戏里分为三个种族——人族、星灵和异虫,在具有未来感的战斗环境里进行实时对抗。
在此之前,DeepMind在国际象棋和围棋等领域开发了领先世界的人工智能。这次,因为《星际争霸II》游戏策略的复杂性和快节奏,DeepMind以《星际争霸II》为接下来的基准来发展通用的人工智能技术,即能够学习或者理解任何人类所能完成任务的机器。
“我没料到人工智能可以在这个领域中如此迅速地具备出类拔萃的能力,在我原来的预想里,也许再过几年也做不到,”俄勒冈州立大学(位于科瓦利斯)的人工智能研究者Jon Dodge说道。在《星际争霸II》中,经验丰富的选手们可以同时做多件事情——管理资源,执行复杂的战斗策略,并最终以决策打败他们的对手。职业选手的游戏节奏极快,每分钟能进行300多次操作。DeepMind人工智能背后的机器学习技术依赖于人工神经网络。该神经网络从大量数据集中学习识别各种模式,而非接收具体指令。
2018年12月,DeepMind第一次让AlphaStar在一系列实验室测试游戏中与高水平玩家对抗。人工智能与两位人类职业选手进行了游戏,并取得胜利。但是评论者们认为这些示范比赛并不公平,因为AlphaStar操作的速度和精准性都超过人类。
在开发团队让AlphaStar离开实验室登陆《星际争霸II》欧洲服务器之前,他们限制了人工智能的反应能力,使竞争更加公平。七月,玩家们收到通知,在匹配游戏对手时,他们可以选择与人工智能有几率地进行匹配。为了使实验不被察觉,DeepMind隐藏了AlphaStar的身份。
“我们想进行盲法实验(blind experiment),” AlphaStar的领队之一David Silver说道。“我们真的想要在这样的条件下进行游戏,并对这一群人类对抗我们的表现有一个真实判断。
AlphaStar的训练获得了成功:它击败了低段位的对手,并最终在90场对战高段位玩家的游戏中收获了61场胜利。
挑战复杂性
《星际争霸II》的复杂程度给人工智能们带来了巨大的挑战。与国际象棋不同,《星际争霸II》有数百枚“棋子”——不同种族大军中的士兵——在即时对抗中同时移动,而非依照有秩序的回合制方式博弈。在国际象棋中,一枚棋子符合规则的走棋方式是有限的,而AlphaStar则每时每刻都有1026种可选择的操作方式。并且,与国际象棋不同,《星际争霸II》是一种不完全信息博弈(a game of imperfect information)——玩家们经常不能看到他们的对手在做什么。这使得这个游戏不可预测。
在将近十年的时间里,研究者已经让《星际争霸》和《星际争霸II》的人工智能玩家们在年度竞赛中相互对战。然而,与AlphaStar不同,大多数自动机器人程序有赖于硬编码(hardcoded)的指令,而非具备能够自学的神经网络。AlphaStar的领队之一Oriol Vinyals,过去是加州大学伯克利分校团队中的一员,他们团队在2010年的首次比赛中取得了胜利。他说,“在那时,我有点开始考虑,也许我们应该做(机器)学习,但是那个时候还太早了。”
2016年,Vinyals加入了DeepMind,开始研究能自学操作《星际争霸II》的人工智能。通过学习模仿将近一百万局人类游戏,AlphaStar开始了它的训练。为了进一步提高AlphaStar的游戏操作,DeepMind创建了一个联赛,让不同版本的人工智能相互对战。帝国理工学院的人工智能研究者Kai Arulkumaran表示,这个方法很有道理,因为像《星际争霸II》这样的游戏,没有一种策略是最好的,对于很多其它的人工智能现实应用来说也是如此。
反应敏捷的玩家
同时,DeepMind也限制了AlphaStar的操作,确保人工智能是真的在思维能力方面击败它的人类对手,而不是凭借操作速度和数量获胜。因为这个游戏奖励快速操作的能力,一台点击速度超过人类的电脑可能打败人类,而不需要比人类更聪明或者做出更优的决策。因此DeepMind限制了AlphaStar的反应速度,使之与经验丰富的人类玩家的速度相当。
在这些条件下,经过27天的训练,AlphaStar跻身于欧洲服务器所有玩家中的前0.5%。
然而,50局游戏过后,DeepMind遇到了一个麻烦。一些玩家已经注意到战网(Battle.net)游戏平台上有三个账号在相似的时间段里玩过相同数量的《星际争霸II》游戏,这三个账号正是AlphaStar秘密使用的账号。在观看游戏回放时,玩家们发现,这个账号使用者的操作对于人类来说,即使不是不可能,也是极其困难的。为了应对这个麻烦,DeepMind开始使用许多技巧来使试验保密,避免玩家们认出AlphaStar,如经常更换游戏账号。
AlphaStar的最终版本依赖于44天的累积训练,并频繁与专业游戏选手对战。与国际象棋和围棋的人工智能们不同,这一人工智能无法打败世界上最优秀的玩家,但是DeepMind认为它达到了基准,并且宣布它已经完成了《星际争霸II》挑战。
其他人工智能科学家还没有被这种言论说服,他们不认为AlphaStar可以宣称完全胜利。加拿大圣约翰市纽芬兰纪念大学的人工智能研究者Dave Churchill认为,AlphaStar还有很多的弱点,比如说无法处理它还没见过的战略。他承认,“AlphaStar非常令人刮目相看,绝对是至今任何星际争霸游戏里最强的人工智能。不过,即便如此,星际争霸的挑战还远未被 ‘解决’,AlphaStar甚至还没有接近世界冠军的水平。”
作者:Dan Garisto
翻译:罗晓玥
审校:郭晓
引进来源:科学美国人
 

本文来自:环球科学
特别声明:本文转载仅仅是出于科普传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或其它相关事宜,请与我们接洽。
[责任编辑:环球科学]
分享到:
文章排行榜
©2011-2022 版权所有:中国数字科技馆
未经书面许可任何人不得复制或镜像
京ICP备11000850号-1 京公网安备11010502039775号
信息网络传播视听节目许可证0111611号
国家科技基础条件平台
./t20191229_935257_taonews.html