“谷歌翻译”将采用深度学习算法提高文本翻译能力,上图为其手机客户端使用示例
9月27日,谷歌宣布其旗下的在线翻译服务——谷歌翻译不久将采用一种完全基于深度学习的新算法。并将在arXiv网站(arxiv.org)上发布预印版论文详细介绍该算法,这种算法成就了首个基于日益兴起的人工智能技术,惠及大众的计算机语言翻译系统。据谷歌计算机科学家说,相比谷歌现有的线上翻译服务,这种算法能减少约60%的翻译错误。
目前一项采用了这一算法的中译英翻译服务已存在于谷歌翻译的移动和网页版应用中。谷歌称基于该算法的其他语言的翻译服务也将在未来数月推出。
这项进展是深度学习取得成功的又一实例。近年来,通过将人工神经网络(该算法借鉴了大脑神经元的连接方式,具有多层计算单元结构)与大量数据集结合,深度学习技术帮助人类破解了人工智能领域的重大问题。尤其在图像识别和人机博弈领域,这项技术击败了其他机器算法。现在谷歌将同样的/这一方法应用在语言翻译上,开发出了一套(所谓的带有贬义)神经机器翻译系统(Neural Machine Translation system,NMTS)。“从输入到输出,整个过程完全由一个神经网络完成”,任职于谷歌加州山景城的计算机科学家Quoc Le说道。
加拿大蒙特利尔大学的计算机科学家Yoshua Bengio在阅读了arXiv上的论文后,认为NMTS借鉴了机器学习的其他发展成果,并且在此基础上进行了一些方法上的创新。 “初看上去,他们用的技术手段并不新鲜”,他说。谷歌科研团队最大的贡献在于展示了“凭借扎实的工程方法和巧妙的结构设计,神经机器翻译可以远远超过机器翻译领域的经典方法”,取得了“颇为惊艳的成果”。
这一算法“确实多方面突破了机器翻译技术的最高水准”,瑞典曼诺卢加诺大学(USI)的计算机科学家Jürgen Schmidhuber说道。
机器翻译
一直以来,谷歌翻译对人工神经网络的应用有限,公司发言人Charina Choi说道。对文本的大部分内容,其翻译算法都是逐词分析,并通过上百万已有的翻译材料,如联合国和欧盟议会的文件,来学习如何关联不同语言中的对应词语。
NMTS同样通过分析已有的翻译材料学习;学习过程中,它一点点地修正人工神经元之间的关联,来提高它的翻译质量。不同的是它先把每个单词拆分为“词片段”,再来分析句子。这一想法由同为谷歌山景城团队成员的Mike Schuster提出,他曾在语音识别软件上采用过这个方法。
“在神经网络的一些表征形式中,这些“词片段”可以通过某种方式结合来表词达意”,Le说。这可能与神经网络处理如人脸识别等视觉任务时的方式相近:从图像中单个像素开始,逐步提升到对愈发复杂的特征的处理,如轮廓边缘、几何纹理等。
用这种神经网络来分析文本,能生成译文。为了提升速度,谷歌在专为机器学习设计的计算机芯片上运行这一系统。今年早些时候击败了人类顶尖围棋选手的AlphaGo,就使用了类似的硬件。
表现评判
为了评价该翻译系统的表现,谷歌研究者从维基百科和新闻文章中抽取句子进行翻译,并将NMTS产出的译文(包括各种语言之间的翻译),与谷歌之前的翻译系统以及人工翻译的译文放在一起。接着,研究团队让受试的评估人员对翻译质量进行盲测评分。
在众所周知难度很大的中译英任务中,NMTS展现出明显进步,但还是稍逊于印欧语系语言之间的互译效果。对于其他的一些语言互译,NMTS的正确率已经接近人类译者,但论文作者也表示这项测试的意义有限,因为翻译样本都是结构严谨的简单句。
Schmidhuber认为,只有在机器能结合各种感官输入后,才能真正赶上或者超过人类的翻译。“目前,它们只能理解‘猫从树上掉下来了’这样的句子”,Schmidhuber说,“未来,它们可以理解猫从树上掉下的视频,还能控制拥有视觉、听觉、移动能力和操纵能力的机器人,甚至能通过痛觉传感器感受疼痛,并将这些体验与需要翻译的文本联系起来。
翻译:史博皓
审稿:林然