每日科学(2011年12月21日)——神经系统科学家和计算机视觉研究人员面临的一个基本问题是如何通过简单的“看”图像来识别物体。我们知道人类大脑可以很好地解决这个问题。我们只需要看看,就可以知道它是什么。
但教计算机“知道”它看的是什么却要困难很多。今年秋天发表在公共科学图书馆计算生物学杂志上的研究文章,查塔姆大学、洛斯阿拉莫斯国家实验室和埃默里大学的一个团队,测试了人们对图像观察后的表现,首先测试的是当某种具有确定形状的图像在一个观众面前闪过一个很短的时间时(20-200毫秒)的情况。正如所料,当图像显示的时间更短时,人们的识别表现会变糟。另外,正如我们所了解的,形状越复杂人们对图像的认知就越糟糕。
但是可否教电脑认识形状,然后做得比人快呢?团队试图开发出一台基于人类神经结构和功能的计算机模型,它能做我们所能做的,并有可能做的更好。
他们的论文“大脑皮层相关区域及人们对目标轮廓感知复杂性模型”,介绍了他们在测试人们对图像识别表现后,如何创造出一个计算机模型并且尝试如何挑选图形的。
“这个模型是利用仿生学并且依靠人类视觉系统模型中同一层中神经元之间的横向连接建立的,”VadasGintautas说,美国匹兹堡大学及洛斯阿拉莫斯国家实验室前研究员。
神经系统学家已经找到灵长类动物视觉皮层用来识别基础物体的神经元的特点,洛斯阿拉莫斯国家实验室资深研究员加勒特•肯扬指出。“这些神经元,位于颞下皮层,当特定的对象可见时可被强烈激活,无论对象多远或对象姿态如何,这种现象称为‘视点不变性。’”
大脑具有探测和识别某些事物的不可思议的能力,即使它们勉强可见。现在的挑战是让计算机做同样的事情。编程使计算机能像大脑一样处理横向的信息,也许是在正确的方向迈出的重要一步。
颞神经元是如何获得视点不变性的还没有找到原因,但许多神经科学家指出,人类视觉皮层组织的分层可能是问题的本质。
“在解决类似任务的模型设计中,神经元横向连接往往被忽视。实验证明,我们的模型能高质量地再现人类完成图像识别任务的能力,无论是在时间和复杂度方面。虽然这并不能保证人类的视觉系统就是使用这种方式来完成图像识别任务的,但它为研究物体识别问题打开了一条新途径,”Gintautas说。
简单物体识别,例如识别一个图像特定方向的边缘,会在大脑第一皮质层中提取,称为初级视觉皮层或V1。然后进入V2、V4皮质处理阶段,提取更加复杂的图像特点,最终,经过叠加,在颞下皮层中发生“视点不变对象识别”。但是,人类大脑的大部分连接并没有映射到皮质层的高一层结构,从神经解剖学看,它们连接在同一皮层,被称为横向连接,有的连接到下一级皮层,来降低执行层次。
最近发表的研究成果,团队建立了皮层边缘探测器之间的横向交互模型,以确定这些连接是否可以解释人类轮廓感知的过程中图像复杂度和时间问题。这项研究利用了由洛斯阿拉莫斯国家实验室研究人员开发的、美国国家科学基金会资助的神经模拟工具箱,即所谓的PetaVision与“视觉速度”生理测量方法进行皮质电路高性能计算机模拟来测量人体轮廓感知。心理测量借鉴了神经学家使用皮质处理机制的技术,使用了开放源码Psychtoolbox软件是一个好的起点。
“我们的研究是第一个从整体精度以及执行过程对人类受试者完成视觉感知任务测试并建立皮质模型的例子,”肯扬说。