据美国每日科学网站近日报道,有史以来第一次,美国科学家研制出的一套新系统,借助语音合成器和人工智能,通过监控某人的大脑活动,将其想法直接转化成了可理解、可识别的语音。研究人员称,最新研究为那些言语能力有限或无法说话的人重新获得与外界沟通的能力奠定了基础,也有望为计算机直接与大脑通信开辟新途径。
几十年的研究表明,当人们说话(甚至想象说话)时,大脑中会出现明显的活动模式。当我们倾听某人说话或想象聆听时,大脑也会出现可识别的信号模式。专家们试图记录和解码这些模式,希望将人们的想法翻译成口头语言。
但实现这一壮举极具挑战性。以前科学家进行的脑部信号解码工作主要集中于构建一些用于分析频谱图(声音频率的视觉表示)的简单计算机模型,但这种方法不能产生任何类似于可理解的语音的东西。哥伦比亚大学莫蒂默•B。祖克曼心脑行为研究所的莫斯尕拉尼团队因此求诸声码器,这是一种计算机算法,可在接受人们说话的录音训练后合成语音。
为了教声码器解释大脑活动,莫斯尕拉尼与神经外科医生阿希什•迪勒希-梅塔合作。在研究中,他们要求接受过脑部手术的癫痫患者听取不同人说的句子,同时测量他们大脑的活动模式,这也是对声码器进行训练。
接下来,他们要求这些患者听说话者复述0到9之间的数字,同时记录可以通过声码器运行的大脑信号。然后,再借助模仿生物大脑中神经元结构的人工智能——神经网络,对声码器响应这些信号所产生的声音进行分析。
莫斯尕拉尼说:“我们发现,这些人可以理解并重复75%的声音,远超以往任何尝试。”
研究人员计划接下来测试更复杂的单词和句子。他们希望该系统可以成为植入物的一部分,将穿戴者的思想直接转化为文字。
莫斯尕拉尼说:“这将改变游戏规则。它有望让任何失去讲话能力的人,重新拥有与周围世界联系的机会。”
每日荐书
去年年前,我最后一次见小玲,是在我导......
莫名的,在一片沉默之中,我突然接收到......
最热文章
人工智能写科幻小说,和作家写科幻小说有什么不一样?
德国概念设计师Paul Siedler的场景创作,宏大气派。
《静音》是一部 Netflix 电影。尽管 Netflix 过去一年在原创电影上的表现并不如预期,但是《静音》仍让人颇为期待
最近,美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员)发布了一份报告,全面分析了 1990 到 2007 年的劳动力市场情况。\n
J·J·艾布拉姆斯显然有很多科洛弗电影在他那神秘的盒子里。\n
我们都知道,到处都在重启;我们也知道,如果有钱,啥都能重启。所以,会不会被重启算不上是个问题,只能问什么时候会被重启。自然而然地,世界各地的各种重启现象衍生出了一个有趣的猜猜游戏:哪一部老作品会是下一个接受这种待遇的?\n