摘要:如果你认为计算机会迅速发展达到真人交流的水平的话,那么现实恐怕会让你失望了。诸如Siri这样的人工智能经常无法准确理解使用者的意思,因为它们的判断理解过程主要是通过单词的统计学规律。这和人类不同,对人来说,语境比单词或是信号更重要。这个结论是从一个研究人员那里得到的。他发明了一种沟通的游戏,只允许非语言的提示,并且用这个游戏去精确定位了大脑中负责互相理解的区域。
游戏双方相互看不见对方,仅通过非语言方式交流游戏规则,这种游戏能够帮助神经系统科学家找出大脑中负责互相理解的部分。
图片来源 :Arjen Stolk(加州大学伯克利分校)
从苹果公司的Siri,到本田汽车公司的机器人Asimo,机器似乎变得越来越擅长和人类进行交流了。但是一些神经科学家警示说现在的机器人并非真正理解我们说的话,因为他们不会像人类一样考虑到谈话所处的环境。
具体来说,加州大学伯克利分校的博士后研究员Arjen Stolk 和他的荷兰同事解释道,机器不会形成对人类,地域,情境的理解,这通常包含着很长的社会历史,而这些对与人类的交流很重要。没有这种常识基础,计算机完全无法理解人类。
“人们倾向于认为交流是语言符号或是手势的交换,却忘记了交流和社会环境、和你交流的对象息息相关。”Stolk 说。
以单词“bank”为例,当你拿着一张信用卡的时候它代表着一种意思——银行,但是当你拿着一根鱼竿的时候会它就表示另一种意思——河岸。如果没有情境,用两根手指比出“V”的手势可以代表着胜利,也可以表示数字二,或者表示“我摔断了这两根手指”。
“所有这些微妙的差别对人们互相理解是很重要的。”Stolk说。它们甚至或许比词语或者信号更为重要,尽管很多计算机专家和神经科学家都认为词语和信号才是交流的关键。“事实上,即使我们不用语言不用单词或者已经有共识的信号,也可以理解他人。”
语言不通的陌生人之间,甚至是婴儿和家长之间,一直都可以进行有效的交流。而这仅仅依靠着手势和他们在短时间内创造出来的情境。
Stolk认为科学家以及工程师应该更关注互相理解中的语境这方面,这是基于脑部扫描的实验证据的论点。它说明人类是通过独特的计算和神经机制获得无需语言的双方理解的。Stolk 已经做的一些研究说明了相互理解能力的缺失可能正是诸如自闭症等社交障碍的幕后元凶。
“探明人们是怎样不需任何语言仍能交流,这为理解正常社交提供了理论以及经验的基础,而且也为理解和对待与神经学,神经发育学相关的社交障碍的人指明了一个新的方向。”Robert Knight 博士说。他是加州伯大学伯克利分校Helen Wills神经科学研究所的心理学教授同时也是加州大学旧金山分校(UCSF) 神经病学以及神经治疗学的教授。”
在发表于1月11日的《认知科学趋势》(Trends in Cognitive Sciences)期刊上的一篇评论中,Stolk和他的同事讨论了概念的校准对于双方相互理解的重要性。
通过脑部扫描探明思维统一时的精确位置
为了探明大脑实现双方理解的方式,Stolk 发明了一个游戏。它需要两个参与者仅通过棋子的移动,相互交流游戏规则,不能说话也不能看见彼此,这样消除了语言和动作/手势的影响,然后对他们进行核磁共振成像检查(functional magnetic resonance imagery),扫描当他们通过电脑进行非语言交流时的大脑活动。
他发现在大脑的同一个区域——位于耳朵上方颅内,未被充分探索的右侧颞叶(right temporal lob)——在他们试图交流游戏规则的时候,双方这个部位都变得非常活跃。而右侧颞叶的颞上回在整个游戏过程中都保持着平稳,活跃度维持在基准范围内。但是当一方突然明白对方试图传达的规则的时候,这部分区域会变得更为活跃一些。大脑右半球在抽象思维以及社交中比左半球有着更深的关系。
“这些右侧颞叶的区域会在你对某事建立了共享信息的时候增加活跃度,而不是在你交流的时候。”Stolk说。“游戏双方越能更好的理解彼此,这部分区域就会变得更为活跃。”
这意味着游戏双方在大脑的同一部分构建着相似的概念框架,不断地测试着对方,确定着他们的概念是相匹配的,只有在新的信息改变了互相理解的时候才会更新。这些结果在2014年被发表在美国国家科学院院刊( Proceedings of the National Academy of Sciences)上。
“这是一项惊人的发现”,Stolk说。“对于双方来说,当他计划路线的时候是静态输入,而接受者在游戏过程中视觉上观察着动态输入,但是在当他们提高了相互的理解时,他们大脑中的同一个区域却变得更为活跃。
机器人的统计学原因
另一方面,机器人和计算机理解对话的过程建立在对单词意思的统计学分析上,Stolk 举例道。如果你经常用“bank”去代表兑现支票的地方,那这就是它在对话中被理解的意思,哪怕当这个对话是关于钓鱼的时候。
“苹果公司的Siri 聚焦在统计学规律上,但人类之间的对话不是基于统计的。”他说,“统计规律可能会帮助我们走到现在,可是这不是大脑的运行的原理。为了让计算机能和我们交流,它们需要一个认知体系(cognitive architecture),并且不断地在对话中捕获并且更新概念。
设想一下,这样一个动态的概念框架是可以使得计算机从根本上解决与真人对话过程中所产生的歧义问题的,包括利用多年前储存的信息。
Stolk的研究已经精确指出了与双方理解有关的大脑区域。在2014年的研究中,他通过信号刺激干扰大脑颞叶区域功能,发现用从以往交流中得到的知识来整合入射信号(incoming signal)是非常重要的。一项较近的研究发现,前额叶有损伤的患者,他们对交流的决策不再与已存储的知识相协调。这两项研究都解释了为什么这类病人在日常社交中出现非正常行为。
Stolk计划与Knigh在今后的研究中利用精细化大脑成像技术——即脑皮层电图扫描,研究志愿者的大脑皮层活动情况。
Stolk 指出他发表该论文的初衷在于促进对于交流的研究并将其关注点提升到一个新的高度——思维概念的统一。
“大多数认知神经科学家关注于信号,单词,手势,以及它们的统计规律,而忽视了我们在交流中用到的潜在的概念能力以及日常生活的灵活性。”他说。“语言非常有用的,但是它是交流的工具而不是交流本身。关注于语言,你会太过在意工具,而忽视了潜在的交流机制,是我们大脑中的认知体系在帮助着我们交流。”
Stolk的共著者是荷兰内梅亨大学( Radboud University)东德尔脑认知与行为研究所( Donders Institute for Brain, Cognition and Behavior)(这也是进行这些研究的地方)的Ivan Toni,还有牛津大学的Lennart Verhagen。
翻译:柯奎宇
审稿:林然
内容源:http://www.sciencedaily.com/releases/2016/01/160111135231.htm
留言