
清华大学微电子所研制出了一款新型收发声一体的可穿戴智能人工喉,或将成为帮助聋哑人“说话”的声学器件。
本刊记者吴非
由于听觉的丧失,一些人失去了学习语言的能力,因而无法通过语言与外界交流。通过辅助设备让聋哑人“开口说话”,成为很多研究人员的目标。事实上,大部分聋哑人的声带并未受损,因此他们可以发出低吟、尖叫或是咳嗽的声音。通常而言,这些简单、无规则的声音不具备任何具体含义,但它们或许隐藏着一组密码等待人们提取——将低吟或尖叫声的音调、强度、持续时间和重复次数组合起来,就可以构成大量独特的发声方式。而每一种发声方式都是一把秘钥,可以与一个特定的含义相对应。这样,通过事先录制好的词汇,聋哑人就可以将低吟、尖叫声转化成能被普通人听懂的语言。
要实现这一想法,首先要解决的是硬件问题——能够实现收发声一体化的声学器件。出于效率与便捷性的考虑,人们希望通过一个尽可能简易的器件,同时解决收声和发声这两个基于不同效应的过程。
聋哑人发声时,喉咙会产生微弱的振动。当他们发出不同的声音,例如音调、强度不同的低吟、尖叫声时,产生的振动波形也各不相同。这时,基于收声材料的压阻效应,振动波形的波动被转化成器件电阻率的变化。
另一方面,发声过程依靠的是热声效应——当温度出现周期性变化时,周围气体的压强随之产生周期性振荡,也就是声波。器件上施加的交流电信号会带来温度的周期性变化,当器件的热容足够小时,更多的热量会传递到空气中,这时就能发出人耳可以识别的声音。
由于同时具备压阻效应与热声效应,石墨烯成为众多研究人员关注的对象。但是,现有石墨烯声学器件仍有一些关键问题需要解决。这篇论文的第一作者、清华大学微电子所的陶璐琪博士告诉《环球科学》:“若要通过热声效应向空气释放热量进而发声,石墨烯器件必须暴露在空气中。然而,现有的接收器件通常需要包裹在聚合物材料中,这就意味着接收器与发生器必须分开工作。”此外,此前的石墨烯容易破裂且对振动的灵敏度低。因此,研制出高灵敏度的收发声一体化柔性器件,就成为推动智能人工喉研究的关键。
在这项研究中,清华大学微电子所任天令团队采用最新的激光直写技术,在特定波长的激光器的照射下,聚酰亚胺薄膜可以直接被转化为多孔石墨烯材料。与此前使用的石墨烯材料相比,具有多孔结构的薄膜对振动有着更高的灵敏度,从而能够识别更微弱的喉部振动。此外,通过激光直写技术制备的石墨烯具有高热导率和低比热容,因此可以将产生的热量变化迅速、灵敏地转化成最终的声音。
在测试中,使用者将器件贴在喉咙处,分别发出高音量、低音量和长时间的低吟声。喉部的振动被器件接收后,经过对波形的智能识别,分别转化成10khz高音量、10khz低音量和5khz低音量的规则波形,实现了声音频率、强度的可控化。而使用者不慎发出的咳嗽声,以及吞咽、点头时产生的振动,也能够被器件准确辨别——这些波形将作为干扰项被去除,以免影响正常的表达。
目前,研究团队尚未将每一种规则波形与某种特定的含义对应起来,而这也是课题组接下来的目标。“我们需要建立使用者的声音信号库,”陶璐琪说,“目前我们尚不清楚器件可以分辨多少种不同的声音,但强度、语调、长度、重复次数,甚至还有其他因素,会让声音种类的组合数量极大地丰富。在丰富语言库的基础上,我们会结合深度学习技术,弄清楚聋哑人语言与正常人语言的映射对应关系。”为了使器件发出混频的词汇,课题组现阶段的另一项工作,是设计与人工喉器件相匹配的功放电路。完成语言库的建立以及词汇的事先录制后,通过人工喉中的专用功放电路,使用者将操控着这些录制好的词汇,让它们带着自己的思想传递至普通人的耳中。
“由于它的高灵敏度、可靠的可重复性、良好的柔性以及简便的制备方式,”研究人员在论文中提到,“这项原创性研究成果将在语音控制、可穿戴电子设备等领域拥有广阔的前景,或将推动石墨烯向着产业化方向进一步迈进。”
留言