北京日报客户端 | 实习记者 何蕊
一枚硬币大小的石墨烯片,贴在颈部靠近喉咙处,就能帮助发音障碍的喉疾患者重获新“声”。近日,清华大学集成电路学院教授任天令团队研发了一款可穿戴人工喉,可以识别喉部发声的信号,并将其转换为语音播放,还原准确率超90%。该成果已发表在《自然》人工智能子刊《自然·机器智能》上。
语言是人类交流的重要方式,但因神经疾病、癌症、外伤等原因导致的声音障碍,以及周围环境噪音干扰等,往往会影响声音的传输和识别。任天令团队基于石墨烯材料,研发的智能可穿戴人工喉,对低频的肌肉运动、中频食管振动和高频声波信息有较高的灵敏度,也具有抗噪声的语音感知能力。此外,人工喉还能通过热声效应将信号转换成声音播放。任天令介绍,人工喉制作过程简单、性能稳定、易于集成,为语音识别和交互提供了一种新的硬件平台。
实验结果表明,人工喉能识别一名喉切除术患者模糊说出的日常词汇,准确率超过90%。识别出的内容被合成为语音在人工喉上播放,可以初步恢复患者的语音交流能力。其抗噪声性能也明显优于麦克风,在60分贝以上环境噪声下仍能保持识别能力。
任天令表示,人工喉还有很大的优化和拓展空间,例如提高声音的质量和音量,增加语音的多样性和表情,以及结合其他生理信号和环境信息实现更自然和智能的语音交互。“希望通过进一步的研究和合作,让人工喉造福更多的声音障碍者和语音交互的用户。”
该成果日前以“使用可穿戴人工喉的混合模态语音识别与交互”为题,在线发表在了《自然》人工智能子刊《自然·机器智能》上。
领取专属 10元无门槛券
私享最新 技术干货