
(图片来源:iStock.com)
从1990年代开始,计算机就逐渐在一些我们的游戏中占得上风,比如国际象棋、跳棋、扑克和《危险边缘》(Jeopardy)。但有一个游戏它们却始终束手无策:围棋。围棋是两个参与者用黑白二色棋子努力占据比对手更多的领域,它的复杂度使得计算机无法精通。但如今,人类在围棋领域的绝对统治好像也要动摇了:谷歌DeepMind宣布,他们创建的一项结合了深度神经网络和搜索技术的高级人工智能程序史无前例地打败了一位围棋冠军。
去年十月,DeepMind团队邀请欧洲的围棋冠军Fan Hui和他们的程序AlphaGo对弈。比赛使用全尺寸棋盘于私下进行,只有几个旁观者。在此之前,AlphaGo已经战胜了一些顶尖的围棋程序,比如Crazy Stone和Zen,495场比赛中只负一场。但和人类对弈是个更大的挑战,毕竟围棋专家有多年的经验和良好的直觉。因此,AlphaGo竟以5-0赢得了比赛,确实是件大事。
很多人预言,在至少10年内,计算机是无法战胜人类围棋冠军的。因此,Amazon的一位软件工程师David Fotland感叹道:“计算机性能这次史无前例的飞跃真是出人意料。”
要理解这个程序让人震惊的原因首先要知道围棋对于计算机来说是一项多么困难的游戏。首先,围棋的走法和结果可谓错综复杂。据研究人员所说,围棋中可能出现的局面数比宇宙中的原子数还多。DeepMind的其中一位创办人,同时也是这项研究的专家之一的Demis Hassabis将围棋与国际象棋做了比较。他发现,在国际象棋游戏中,平均每次只有20种可能的走法,而围棋却有200种。这意味着,要计算机搜索围棋所有可能的走法和结果需要巨大的计算能力,有人甚至认为这是不可能达到的。
阿尔伯塔大学(the University of Alberta)的计算机科学家Jonathan Schaeffer解释说,计算机难以精通围棋的另一个原因是围棋棋手需要具有大量的经验知识。“对于国际象棋,只需少量知识即可创建一项厉害的游戏程序。”Schaeffer解释道,“但对于围棋,这样可不行。”这是因为,计算机在下国际象棋时能遵循一套事先编程好的规则,但这种方式对于围棋却行不通——围棋的局面太多了,不是事先写好的逻辑规则可以囊括的。
DeepMind团队的系统探讨了有关大数据搜索和缺乏经验的问题。在本周发行的《自然》杂志中,他们发表的文章描述如何结合一项搜索技术和深度学习来跨越这些障碍。(《科学美国人》隶属于《自然》出版集团。)
为了解决经验问题,他们在这个项目中采用了两个13层的深度神经网络,它们由成千上万个类似人类大脑中的神经连接的连接组成。研究人员用两种方式训练这些神经网络:对其中一个网络,给计算机展示三千多万种围棋专家的下法(帮助系统学习专家的获胜方式);对两个网络,都让计算机和自己对弈成千上万次,好让它们自行学习并发掘新招式。这两种训练方式使得计算机能够识别游戏中的局面,并确定哪一种走法是最有利的。
对于棘手的搜索问题,研究人员利用了一项称为the Monte Carlo Tree Search的特殊搜索技术。这项技术早就存在并且已经用于其它计算机游戏程序了,本质上是利用统计数据来确定最佳走法,而不是将一个给定走法的所有可能结果都模拟一遍(在围棋中,这要花费很长时间)。
这项搜索技术和深度学习的工具并不是首次出现,许多被使用的围棋程序也采用了the Monte Carlo Tree Search和神经网络。那究竟是什么让DeepMind的AlphaGo如此先进呢?答案就在于研究人员利用这些工具的方式,以及深度神经网络的高性能。“主要的新颖之处就在于他们结合这些复杂成分的方式——他们有所创新。”蒙特利尔大学的一名计算机科学家Yoshua Bengio解释道,她并未参与这项研究。而Schaeffer说他对成果印象深刻:“比起人们过去的方式,这个更简洁、全面。我认为这是一次巨大的进步。”也正是研究人员的创新使AlphaGo能够战胜Fan Hui。
即使并不是所有人都关心计算机是否战胜围棋冠军,这项进步对于其它领域同样重要。研究人员用通用的方法来创建这项系统,而不是只为了下围棋而创建某些部分,意在“最终将这些技术应用于一些重要的现实问题”,Hassabis解释道,“我们希望它们有一天能帮助我们处理一些社会上最棘手和迫切的问题,从气候模型到复杂的疾病分析。”Yoshua Bengio认为另一个重要的应用是在计算机会话方面,而Schaeffer认为,在未来,这些程序可能会找到办法将像游戏一样的社会问题抽象化,比如国际政治或国际气候谈判。
但AlphaGo面临着一个更加迫切的问题:如何打败世界上最厉害的棋手李世石。今年三月,AlphaGo和李世石将在韩国首尔对战。尽管AlphaGo在和Fan Hui的对战中表现出色,但Schaeffer和Fotland仍预测它会败给李。“我觉得围棋专家会赢,”Fotland推测,“但我觉得他会被这个程序的强大所震撼。”至少到目前为止,仍有一些人把赌注压在人类身上。
翻译:吴苏栗 审校:檀泽浩








京公网安备11010502039775号


