脑机接口与AI赋能无障碍语音技术

原创

用户11764306

发布于 2025-12-27 13:19:16

340

Cognixion赋予用户思想以声音

某中心旗下基金投资的Cognixion公司，其辅助现实架构旨在通过将脑机接口与机器学习算法、辅助技术以及增强现实应用集成在可穿戴设备中，克服言语障碍。

技术核心：Cognixion ONE

当前该技术的具体体现是一款名为Cognixion ONE的非侵入式设备。它通过头显呈现交互对象，检测并解码与视觉注视相关的脑电波模式。这些信号使得用户无需动手或出声，即可控制AR/XR应用来生成语音，或向智能家居组件、AI助手发送指令。

设计哲学：从最难处着手

设计的关键约束在于不能对用户的手、臂或嘴部的使用能力做任何假设。因此，交互设计的出发点是最极端的情况：用户完全没有身体自由度，唯一的自由度是“注意力”。通过向用户视网膜投射特定类型的视觉刺激，并观察其注意力反应，可以驱动与计算机的交互。基础的二分选择（如注视两个不同运动特征的图像）可以构建出完整的交互界面。

在此基础上，结合过去五到十年机器学习领域的巨大进步，可以更积极地预测用户的意图或情境的恰当性，从而最小化所需的交互次数。集成关于用户环境、先前话语、时间等知识，使架构能够利用最少的输入和强大的预测能力，帮助人们流畅高效地沟通。

技术应用场景

1. 语音生成

首要目标是生成语音。关键技术突破在于提升“会话速率”。对于许多技术使用者而言，达到每分钟20-30词曾是遥不可及的目标。该技术致力于实现有意义的日常对话。

未来增强方向包括利用语音银行和文本转语音技术（如某机构网络服务的Polly），为每位用户提供个性化的声音，使体验更丰富、更有意义。

2. 环境控制与扩展交互

语音生成仅是广泛的“神经假体”功能之一。该技术也致力于实现与地点、物体和媒体的非语音交互。例如，正在构建的某中心Alexa集成，可让用户通过头显控制家庭自动化、智能设备，或访问新闻、音乐等。

长远来看，设备可使用户控制辅助导航的移动设备、处理家务的机器人，调节环境灯光和温度，从而让更多人更积极、独立地生活。

未来发展与挑战

关键技术挑战

界面表达性： 需要设计一种刺激-响应范式，在用户界面内提供足够有意义的选项，让用户能高效使用系统而不至于过度疲劳。核心问题是在任何给定时间能区分多少种独特的频率信号。
零学习曲线： 商业设备应要求近乎零的学习成本。佩戴后几分钟内即可使用。
反馈与训练： 考虑将刺激-响应技术与显示器、扬声器或触觉反馈结合，提供生物反馈以帮助训练大脑，加快学习速度。

发展路径

目标是算法上巩固和加强系统的可靠性与准确性。应用探索方面，正同时推进医疗通道和研究通道：

医疗通道： 初始应用指征是语音生成和环境控制。未来可能将控制“气泡”扩展到与人、地点、事物和内容的更多交互。此外，系统还可能应用于另外三个医疗领域：利用传感器和闭环特性进行眼科和神经科诊断；针对注意力、专注力和记忆力问题的治疗；以及具备网络能力的远程医疗监测。
研究通道： 使用相同的医疗级硬件，但搭载不同的软件，以支持生物特征分析和实验性AR应用开发。正在积极寻求研究合作伙伴以获得早期设备访问权限。