
此次人机扑克大战巅峰表演赛由人工智能工程院院长李开复发起,参与对战的一方是由六位华人顶尖扑克选手组建的“中国龙之队”,另一方则是卡内基梅陇大学开发的Libratus无限德州扑克人工智能系统。
“这场比赛证实了:人工智能已从完美信息的AlphaGo,延伸到了不完美信息的冷扑大师。人机对战基本没有悬念了,据闻AlphaGo近期即将来华和柯洁对战,其实已经不再具有科学意义了。”李开复在比赛结束后第一时间表示。

相比于之前赚足眼球的AlphaGo,冷扑大师的获胜具有更加特殊的意义。“如果AlphaGo是超级IQ天才,那么‘冷扑大师’就是超级EQ天才。”李开复如此形容两者的差别。围棋和德州扑克代表了AI处理人机对弈的两种信息模式——完美信息和不完美信息。在博弈论中,完美信息指后参与者可观察到前参与者的行为。不完美信息指参与者做选择的时候不知道其他参与者的选择。
“扑克在几十年来一直是人工智能和博弈论中一个高挑战性的问题。”开发“冷扑大师”的Tuomas Sandholm教授介绍道,不同于前20年里,被人工智能攻克的围棋、国际象棋、西洋双陆等“完美信息”游戏,德州扑克是信息不对称的博弈,每位选手只能看到自己的手牌,如此决定了“冷扑大师”需要面对大量不完整信息。
冷扑大师大高明之处在于,不需要像AlphaGo那样提前背大量棋谱,而是从零开始,基于扑克游戏规则针对游戏中对手劣势进行自我学习,通过博弈论来衡量和选取最优策略。
从技术上来讲,扑克的游戏规则更像处理真实世界的问题。冷扑大师更接近人性,对于现实世界中的信息隐瞒以及欺骗等种种现象具备一定的分析和推理能力,能在不完全的信息中充分计算分析。
“世界上的大部分决策问题、商业问题,都不是单纯靠强力的搜索和人工智能就可解决的。”李开复说,“冷扑大师”是高“情商”的,这样的技术可以在很多商业领域应用。这套人工智能扑克程序背后的模型将适用于需要用到战略推理和多方谈判的场景。他预计,十年内,从企业谈判、商务谈判、外交谈判、甚至到生活面的房屋买卖谈判,会部分或全面被人工智能取代。中国数字科技馆(记者蒲潇 综合报道)