索尼的《GT赛车》(Gran Turismo)是有史以来最大的赛车游戏系列之一,全球销量超过8000万份。
索尼公司的人工智能(AI)研究部门领导的一个团队取得了新的突破,开发了一款完全由机器学习驱动的AI玩家,不仅能够学习和掌握游戏,还能在竞争中击败世界上最好的人类玩家。
名为Gran Turismo Sophy的AI代理使用深度强化学习来练习游戏《Gran Turismo Sport edition》,一次控制多达20辆车,以加速数据收集和完善自己的改进。
在学习了几个小时的如何控制游戏的物理特性之后——也就是掌握了如何应用速度和刹车以最好地保持在赛道上——在参考数据集中,人工智能比95%的人类玩家都要快。
为了赶超剩下的5%人类对手,GT Sophy 加倍训练。
该团队在描述该项目的一篇新研究论文中解释说:“它又训练了9天或更多天数,累积了超过45000小时的驾驶时间,成绩缩短了十分之一秒,直到它的圈速停止提高。”
“通过这种训练程序,GT Sophy在所有三条赛道上都取得了超人般的计时表现……平均圈速大约相当于人类单圈最佳记录。”
这已经不是我们第一次看到人工智能学会如何在游戏中战胜人类玩家了。多年来,随着各种各样的AI代理想出如何在各种游戏中战胜普通人,胜利者的数量不断增加。
雅达利、国际象棋、星际争霸、扑克和围棋可能都是由人类创造的游戏,但人类不再是最擅长玩这些游戏的人。
当然,这些游戏要么是策略导向型游戏,要么是玩法相对简单的游戏。《GT赛车》不仅是一款电子游戏,而且是一款逼真的驾驶模拟器。
研究人员在他们的研究中写道:“人工智能的许多潜在应用都涉及到在与人类互动时,在物理系统中做出实时决策。”
“赛车是这些情况的一个极端例子:车手必须执行复杂的战术,在牵引力极限的情况下超过或阻挡对手。”
然而,对于GT Sophy的测试,并不仅仅是其掌握游戏的战术和技巧。人工智能还必须擅长赛车礼仪——学会如何在运动精神的原则下战胜对手,尊重其他汽车的行驶路线,避免发生故障碰撞。
最终,这些都不是问题。在2021年举行的一系列赛车比赛中,这款AI与世界上最优秀的《GT赛车》玩家进行了较量,其中包括三冠王宫园拓真(Takuma Miyazono)。
在7月的一场比赛中,人工智能在计时赛中击败了人类选手,但在面对面较量中没有获胜。经过研究人员的一些优化,该代理学会了如何进一步提高其性能,并在10月轻松赢得了一场比赛。
尽管取得了这些成就,GT Sophy的发明者承认,人工智能还有很多领域有待改进,尤其是在战略决策方面。即便如此,在有史以来最先进的赛车游戏之一中,它已经是一个比我们都好的赛车手。
这对未来意味着什么还不得而知,但很有可能有一天,像这样的系统可以用来控制真实世界的车辆,比人类专业司机做得更好。在虚拟世界中,它已经存在了。
研究人员总结道:“模拟赛车是一个需要在具有高度现实、复杂的物理环境中进行实时、连续控制的领域。”“GT Sophy在这种环境下的成功首次表明,在一系列汽车和赛道类型上,训练出比顶级人类选手更好的AI代理是可能的。”
研究结果发表在《自然》杂志上。
(独家编译:科幻世界)
最热文章
人工智能写科幻小说,和作家写科幻小说有什么不一样?
德国概念设计师Paul Siedler的场景创作,宏大气派。
《静音》是一部 Netflix 电影。尽管 Netflix 过去一年在原创电影上的表现并不如预期,但是《静音》仍让人颇为期待
最近,美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员)发布了一份报告,全面分析了 1990 到 2007 年的劳动力市场情况。\n
坏机器人制片公司最新的一部电影名为《霸主》(overlord),背景设置在二战时期,很可能是一部在半遮半掩中秘密制作的科洛弗电影系列。
我们都知道,到处都在重启;我们也知道,如果有钱,啥都能重启。所以,会不会被重启算不上是个问题,只能问什么时候会被重启。自然而然地,世界各地的各种重启现象衍生出了一个有趣的猜猜游戏:哪一部老作品会是下一个接受这种待遇的?\n