神经科学影响力研究结果出来后,伦敦大学学院(UCL)可以吹嘘一阵了。这并不是人类给出的意见而是计算机程序的输出结果。该程序至今解析了250万篇神经科学文章的内容,映射了它们间的所有引用,并计算出在每位作者在其余部分影响力分数。前十位最有影响力的神经学家有三位都来自UCL:Karl Friston(第一),Raymond Dolan (第二)以及Chris Frith (第七)。那他们成功的秘诀是什么?“我们很早就开始研究人类功能性大脑图片,”Frith说道。越早得到那些图片就使“最先做出大量显而易见的研究”成为可能。
这个程序被称为“Semantic Scholar”,是一个由华盛顿州西雅图艾伦人工智能研究所(AI2)开发的在线工具。在四月首次亮相时,它基于计算机领域两百万篇论文计算出最有影响力的计算机科学家。自那之后,AI2团队已经扩大资料库到一千万篇论文,其中的25%来自神经科学家。明年他们希望能继续扩大资料库直到包涵所有的生物医疗文献,预计超过两千万篇。
当Semantic Scholar看到一篇在线发表的论文时,它究竟看到了什么?此次项目发起人,AI2的CEO Oren Etzioni表示,它比传统的学术搜索引擎好太多。同时他说道:“我们正使用机器学习,自然语言处理以及机器视觉去探究语义。”
例如,使用Semantic Scholar检索关于鸣禽基底节研究的结果。结果搜索页面左侧是Semantic Scholar从文章中解析出的东西:不仅仅有传统的书目数据,例如出版日期和作者隶属,还包括实验中使用的细胞类型甚至方法。我们将系统可以回答人类问题作为目标,Etzioni说:“可以认为它是科学界的Siri,但性能还要更好。”
Sam Gershman,哈佛大学的计算神经科学家,本周试用了Semantic Scholar。“这是一个很酷的工具!相比于Google Scholar它更具一些明显优势, ”他说道,“例如能够对文章进行更细粒度的排序以及展示文章的参考文献和数字统计。”但是Gershman也很快的发现了困扰所有搜索引擎的问题:脏数据。例如,科学家在他们所有的论文中并没有使用相同的命名方式,歧义问题也仍然是Semantic Scholar的困扰。同时,论文的元数据也存在错误。Gershman的一篇论文被列在了1987年,那时他可才两岁!
但是令Gershman最迷惑的问题是,怎样的论文能够得到最高影响分数。“‘最有影响力的出版物’有时甚至会得到奇怪的结果” 他说道。例如,得出最有影响力的文献中没有一篇在Thomas Griffiths(加州大学伯克利分校的心理学家)认为的五大引用最多的文章之列。
但Etzioni强调说Semantic Scholar是一个在进步中的项目。“我们的确存在错误,”他承认说。
但这并没有阻止Science Insider想根据当前的数据得出最具影响力的神经科学家。事实证明,十大名单上的三位UCL研究者在职业生涯早期就已经彼此认识。“19世纪80年代末期我们开始一起在Hammersmith医院(英国)的MRC回旋加速器室工作,”Dalan说道。“1993年我们一起跳槽到了UCL并在同一个部门工作。” Frith指出Semantic Scholar的检测结果很正确,他认为他的妻子以及他UCL的同事Uta Frith已然是他事业上最具有影响力的人。
Friston,技术分析脑图像数据以及大脑工作的计算模型领域的先驱者,用幽默回应了他名列榜首的消息。“我首先想到的是‘我将这个消息告诉谁不会显得自负?’” 他说道,“然后我意识到唯一想要听到这消息的人是我的孩子。”
翻译:聂辰成
审稿:董子晨曦