曾凡钢：Artificial Intelligence Applications in Audiology：AI和OTC助听器

文章来源：企鹅号 - 听力行业通讯

2023年5月28日，由北京听力协会主办的“2023北京国际听力学大会”在北京国际会议中心圆满结束。本届大会邀请了来自美国、加拿大、丹麦、葡萄牙等海内外共50余位专家学者参与主题分享，共有4场主题报告、2场圆桌论坛、1场案例专场。在此，我们将学术演讲与讨论的精彩内容整理并分享，希望能推动行业专业发展。

5月27日上午，美国加州大学尔湾听觉中心主任曾凡钢教授作了题为“Artificial Intelligence Applications in Audiology：AI和OTC助听器”的主题发言。

曾凡钢，美国加州大学尔湾听觉研究中心主任，耳鼻喉-头颈外科学系研究主任，及解剖与神经生理学、生物医学工程、认知科学和耳鼻喉四个系的终身教授（2000年至今）。于2023年当选美国工程院外籍院士。北京听力协会理事。

曾凡钢教授从「信息」和「观点」两个角度解读AI和OTC助听器市场。

AI与OTC助听器

在2018年的北京国际听力学大会上，曾凡钢教授指出，2018年是人工智能在助听器或听力行业里的元年。时隔五年，今天的人工智能发生了哪些变化？

各大厂商增加了传感器、更好的无缝无线的连接等，但不属于真正的“人工智能”，曾教授认为其最多只能称之为“AI助手”；

一大批初创企业（其中更多的是做传统智能的企业）想借助人工智能技术的优势进入听力领域，但由于人工智能对算法、算力要求太高，因此产生了更多繁琐配件。曾教授认为其进入市场过早；

Apple、sumsang、sony等大厂进入了听力市场。世界上拥有助听器最多专利的企业不是Big5，而是Apple和sumsang。这些大厂因为政策和风险原因不愿介入医疗市场，而是在做hearables产品。苹果去年一年保守估计卖出6000万台airpods，销售额约180亿美金。相比之下，全球所有的听力行业（包括助听器、人工耳蜗等）销售额总计共约120亿美金。

目前许多传统大厂、电声企业等都加入了OTC hearing aids这个市场，仔细看产品模式和Airpods类似，但在价格方面，主流的 OTC 的产品的在1000 到 2000 美元左右。曾教授认为目前的厂家太多、但价格又太贵。

美国OTC法案得到了政策支持，历任三任总统，参众两院两党全部支持。共和党支持 OTC hearing aids，是市场经济下引入更多产品可以促进自由竞争；民主党支持OTC hearing aids，是降低价格下普通民众都可以买到产品。因此OTC hearing aids 法案减少了厂商进入市场的障碍，使患者更容易得到产品，互惠互利。

在OTC法案中最重要的一个条款，是限制最大输出声压。这要求所有频率段的最大输出不能超过117dB SPL。听力学家、美国听力学会均表示，我们要限制最大的增益，不能让它的增益太高。

为什么要定在117dB SPL呢？

1. 从执法角度来看，去测量增益很困难，需要知道输入、输出这两个参数；但如果只界定最大输出的话相对更简单。

2. 最大输出设定为 117dB SPL的话，通过公认助听器验配算法计算出的最大增益可以达到78dB 。

3. FDA同时没有规定不能再增加音量控制，意味着从执法和规范的角度来说，OTC助听器基本可以涵盖目前所有助听器的范围。

曾教授认为，现在是门户大开，百家争鸣，颇有战国时期的味道。这个市场是开放的，谁都可以进入。

目前，专家们认为这个市场3年左右会达到相对稳定的状态；价格会从1-2k美元降至200美元左右；100-200家企业经过市场淘汰，最终可能不超过10家最终存活，成为市场主导。

最重要的是，我们所从事的事业是让更多的人去受益，OTC助听器如果发展良好，我们甚至可以让从未使用过助听器的这些病人受益。

要做到这一点，必须解决以下两个痛点。

1. 解决鸡尾酒会问题

2. 实现自动验配

鸡尾酒会效应

鸡尾酒会效应描述的是在一个比较真实的聆听的环境下，我们听懂言语的能力。

在多个人说话的时候，能听见并听懂另外一个人的话；

在多个人同时说话时，能先听见第一个，再听见第二个甚至第三个人说话，可以实现转换。

目前助听器的“降噪”，在帮助用户在噪声中拾取语音，他们是如何实现的？

假设我已知我想听谁在说话，有许多种方法：

可以做硬件，将麦克风挂在说话人身上，即 FM system ；还可以有聚焦的麦克风，对准说话的人；

可以做软件，比如通过人工智能，使用视觉肢体语言来表达说话人的目的等。

假设我不知道想听见的这个人是谁，则可以通过测脑电波先客观获取用户想听的声音对象，再将它转换成已知的对象，随后使用硬件或软件来实现“降噪”。

目前，现有的助听器里也采取了一些人工智能的技术，但它“取了一个巧”——鸡尾酒会，有很多人谈话，很多种酒，但目前的降噪技术是剔除了其他的酒，其他的人的说话声，只剩下了你想听的那个人的声音。实际上它是把“噪声中的言语识别”变成了“安静条件下的言语识别”。这和恢复正常听力是两码事。

未来的人工智能的技术，或许能使听障病人恢复正常的、甚至增强听力。

那这一点是如何做到的呢？

从技术层面上，无论专家还是大厂（包括google、facebook等等）都在研究。

从“听”的层面来说，和传统助听器的“降噪”概念完全不同——区别在于，我们改变外部的声音，将听损患者听起来“不舒服”、“听不懂”的声音变成经过受损听觉系统反而听起来“很舒服”、“很清楚”的声音。

从“说”的层面来说，有的人说话很清楚，有的人说话没那么清楚，是否有可能在“说”的方面做工作——现在的生成式人工智能技术在这方面大有可为。

所以，将“Listener”和“Speaker”结合起来，曾教授的观点是，我们要以听障人士听的声音为标准，以听障人士听到声音为标准，达到恢复、甚至增强正常听力。5 年内可能不一定实现，但相信随着脑机接口等技术进展， 10 年、 20 年是有可能的。

在来北京前，曾教授咨询了6位来自学术界、工业界的行业专家三个问题：

1. 人工智能是否能解决“鸡尾酒会”的问题？

6人回答均为“是”。

2. 什么时候能用到助听器上面？

2-5年。

3. 主要的技术障碍是什么？

6人回答“算力”；

4人回答“电力”；

3人回答“实时”；

2人回答“当地或边缘AI”。

GPT与自验配

关于自动验配，未来是否能通过ChatGPT实现？

曾教授假设了一种“对温度敏感的听神经病”的病人的情况，向ChatGPT提问。但ChatGPT只会给出标准答案，无法实现推理。因此曾教授认为，目前阶段下的ChatGPT只是“会说人话的统计而非推理专家”，还是需要医生/专业人士根据病患信息推断进行诊断。

曾教授最后总结，助听器未来的市场或许是 AI 加 OTC 。有两个标志：

1．解决了鸡尾酒会的问题，让听障人士真正恢复了正常听力；

2. 近期能自动验配的助听器并不是 AI 堆积起来的，反而是一个“Keep It Simple Stupid”的助听器。

关注公众号：听力行业通讯，前往“听力学院”，查看专家演讲分享

编辑：一岚

排版：洪昊辰

发表于: 2023-07-072023-07-07 16:59:43
原文链接：https://page.om.qq.com/page/OWraOzUC1hvqKJM-h1L5pOUg0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

曾凡钢：Artificial Intelligence Applications in Audiology：AI和OTC助听器

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐