首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

曾凡钢:Artificial Intelligence Applications in Audiology:AI和OTC助听器

2023年5月28日,由北京听力协会主办的“2023北京国际听力学大会”在北京国际会议中心圆满结束。本届大会邀请了来自美国、加拿大、丹麦、葡萄牙等海内外共50余位专家学者参与主题分享,共有4场主题报告、2场圆桌论坛、1场案例专场。在此,我们将学术演讲与讨论的精彩内容整理并分享,希望能推动行业专业发展。

5月27日上午,美国加州大学尔湾听觉中心主任曾凡钢教授作了题为“Artificial Intelligence Applications in Audiology:AI和OTC助听器”的主题发言。

曾凡钢,美国加州大学尔湾听觉研究中心主任,耳鼻喉-头颈外科学系研究主任,及解剖与神经生理学、生物医学工程、认知科学和耳鼻喉四个系的终身教授(2000年至今)。于2023年当选美国工程院外籍院士。北京听力协会理事。

曾凡钢教授从「信息」和「观点」两个角度解读AI和OTC助听器市场。

AI与OTC助听器

在2018年的 北京国际听力学大会上,曾凡钢教授指出,2018年是人工智能在助听器或听力行业里的元年。时隔五年,今天的人工智能发生了哪些变化?

各大厂商增加了传感器、更好的无缝无线的连接等,但不属于真正的“人工智能”,曾教授认为其最多只能称之为“AI助手”;

一大批初创企业(其中更多的是做传统智能的企业)想借助人工智能技术的优势进入听力领域,但由于人工智能对算法、算力要求太高,因此产生了更多繁琐配件。曾教授认为其进入市场过早

Apple、sumsang、sony等大厂进入了听力市场。世界上拥有助听器最多专利的企业不是Big5,而是Apple和sumsang。这些大厂因为政策和风险原因不愿介入医疗市场,而是在做hearables产品。苹果去年一年保守估计卖出6000万台airpods,销售额约180亿美金。相比之下,全球所有的听力行业(包括助听器、人工耳蜗等)销售额总计共约120亿美金。

目前许多传统大厂、电声企业等都加入了OTC hearing aids这个市场,仔细看产品模式和Airpods类似,但在价格方面,主流的 OTC 的产品的在1000 到 2000 美元左右。曾教授认为目前的厂家太多、但价格又太贵

美国OTC法案得到了政策支持,历任三任总统,参众两院两党全部支持。共和党支持 OTC hearing aids,是市场经济下引入更多产品可以促进自由竞争;民主党支持OTC hearing aids,是降低价格下普通民众都可以买到产品。因此OTC hearing aids 法案减少了厂商进入市场的障碍,使患者更容易得到产品,互惠互利。

在OTC法案中最重要的一个条款,是限制最大输出声压。这要求所有频率段的最大输出不能超过117dB SPL。听力学家、美国听力学会均表示,我们要限制最大的增益,不能让它的增益太高。

为什么要定在117dB SPL呢?

1. 从执法角度来看,去测量增益很困难,需要知道输入、输出这两个参数;但如果只界定最大输出的话相对更简单。

2. 最大输出设定为 117dB SPL的话,通过公认助听器验配算法计算出的最大增益可以达到78dB 。

3. FDA同时没有规定不能再增加音量控制,意味着从执法和规范的角度来说,OTC助听器基本可以涵盖目前所有助听器的范围。

曾教授认为,现在是门户大开,百家争鸣,颇有战国时期的味道。这个市场是开放的,谁都可以进入

目前,专家们认为这个市场3年左右会达到相对稳定的状态;价格会从1-2k美元降至200美元左右;100-200家企业经过市场淘汰,最终可能不超过10家最终存活,成为市场主导。

最重要的是,我们所从事的事业是让更多的人去受益,OTC助听器如果发展良好,我们甚至可以让从未使用过助听器的这些病人受益。

要做到这一点,必须解决以下两个痛点。

1. 解决鸡尾酒会问题

2. 实现自动验配

鸡尾酒会效应

鸡尾酒会效应描述的是在一个比较真实的聆听的环境下,我们听懂言语的能力。

在多个人说话的时候,能听见并听懂另外一个人的话;

在多个人同时说话时,能先听见第一个,再听见第二个甚至第三个人说话,可以实现转换。

目前助听器的“降噪”,在帮助用户在噪声中拾取语音,他们是如何实现的?

假设我已知我想听谁在说话,有许多种方法:

可以做硬件,将麦克风挂在说话人身上,即 FM system ;还可以有聚焦的麦克风,对准说话的人;

可以做软件,比如通过人工智能,使用视觉肢体语言来表达说话人的目的等。

假设我不知道想听见的这个人是谁,则可以通过测脑电波先客观获取用户想听的声音对象,再将它转换成已知的对象,随后使用硬件或软件来实现“降噪”。

目前,现有的助听器里也采取了一些人工智能的技术,但它“取了一个巧”——鸡尾酒会,有很多人谈话,很多种酒,但目前的降噪技术是剔除了其他的酒,其他的人的说话声,只剩下了你想听的那个人的声音。实际上它是把“噪声中的言语识别”变成了“安静条件下的言语识别”。这和恢复正常听力是两码事。

未来的人工智能的技术,或许能使听障病人恢复正常的、甚至增强听力。

那这一点是如何做到的呢?

从技术层面上,无论专家还是大厂(包括google、facebook等等)都在研究。

从“听”的层面来说,和传统助听器的“降噪”概念完全不同——区别在于,我们改变外部的声音,将听损患者听起来“不舒服”、“听不懂”的声音变成经过受损听觉系统反而听起来“很舒服”、“很清楚”的声音。

从“说”的层面来说,有的人说话很清楚,有的人说话没那么清楚,是否有可能在“说”的方面做工作——现在的生成式人工智能技术在这方面大有可为。

所以,将“Listener”和“Speaker”结合起来,曾教授的观点是,我们要以听障人士听的声音为标准,以听障人士听到声音为标准,达到恢复、甚至增强正常听力。5 年内可能不一定实现,但相信随着脑机接口等技术进展, 10 年、 20 年是有可能的。

在来北京前,曾教授咨询了6位来自学术界、工业界的行业专家三个问题:

1. 人工智能是否能解决“鸡尾酒会”的问题?

6人回答均为“是”。

2. 什么时候能用到助听器上面?

2-5年。

3. 主要的技术障碍是什么?

6人回答“算力”;

4人回答“电力”;

3人回答“实时”;

2人回答“当地或边缘AI”。

GPT与自验配

关于自动验配,未来是否能通过ChatGPT实现?

曾教授假设了一种“对温度敏感的听神经病”的病人的情况,向ChatGPT提问。但ChatGPT只会给出标准答案,无法实现推理。因此曾教授认为,目前阶段下的ChatGPT只是“会说人话的统计而非推理专家”,还是需要医生/专业人士根据病患信息推断进行诊断。

曾教授最后总结,助听器未来的市场或许是 AI 加 OTC 。有两个标志:

1.解决了鸡尾酒会的问题,让听障人士真正恢复了正常听力;

2. 近期能自动验配的助听器并不是 AI 堆积起来的,反而是一个“Keep It Simple Stupid”的助听器。

关注公众号:听力行业通讯,前往“听力学院”,查看专家演讲分享

编辑:一岚

排版:洪昊辰

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OWraOzUC1hvqKJM-h1L5pOUg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券