如果有一天,你无法清晰地表达自己的思想,无法用语言来传递喜怒哀乐,那将是多么令人沮丧。然而,科学的进步正在将这一困境变为历史。
加州大学的一项颠覆性的突破,首次让一位因疾病失语的患者通过脑机接口(BCI)系统,不仅能说出想说的话,还能带有语气、情感,甚至能唱歌。这一研究结果刚刚发表在国际著名期刊《Nature》上。
这项世界首创的技术利用人工智能AI的力量,实时解码大脑活动,将思想转化为富有表情的语音,研究团队在一位45岁患者身上实现了,这位患者因患肌萎缩侧索硬化症(一种运动神经元疾病)而失去了清晰说话的能力,尽管他还能发出声音并努力张嘴说话,但语速缓慢且含糊不清。在症状出现五年后,他接受了手术,将256个硅电极植入大脑控制运动的区域,每个电极长1.5毫米。
与以往的脑机接口不同,这项新系统克服了只能产生平淡、单调语音的局限。它能捕捉并再现自然语言中的多种元素,如语调、音高和重音,这些对于表达意义和情感至关重要。该系统能够在神经活动发出意图后10毫秒内,就通过合成语音说出他的话。这意味着,当他尝试说话时,系统能够实时解码他试图发出的声音,而不是仅仅解码预设的单词或音素。这被专家誉为言语脑机接口的圣杯,实现了真正的、自发的、连续的言语。
研究团队还特意个性化了合成声音,使其听起来就像患者本人原来的声音。他们通过训练AI算法,学习患者在疾病发作前接受采访的录音,从而实现了这一点。患者甚至被要求尝试发出“aah”、“ooh”和“hmm”之类的感叹词以及编造的词语。结果显示,BCI成功地产生了这些声音,这表明它无需固定词汇表就能生成语音。
通过这个设备,患者可以拼写单词、回答开放性问题,并说出任何他想说的话,包括一些未包含在解码器训练数据中的词语。当他听到合成语音说出自己的话时,他告诉研究人员,他感到非常高兴,并且感觉那就是他真正的声音。在其他实验中,该系统甚至能识别患者是想提问还是陈述,还能确定他在同一句话中强调了哪些词语,并相应调整合成语音的语调。它甚至能让他哼唱一系列音符,并改变音高,实现简单的歌唱。
这项技术预示着未来,人类能够通过脑机接口清晰、富有表现力地说话,无疑为全球数百万面临沟通障碍的人带来了希望的曙光。
参考文献:Wairagkar, M. et al. Nature https://doi.org/10.1038/s41586-025-09127-3 (2025).