一家互联网大厂的新尝试:捐钱?不如捐技术

摘要

拥有成熟技术的公司,如何把技术开放出去,实现真正的科技无障碍?

 一家公司如何在资金捐赠之外,以技术捐赠的形式做公益? 这个故事提供了一个参考样板。 国产人工耳蜗公司诺尔康想要研发新一代耳蜗产品,尝试将无线蓝牙、AI 算法等技术加入其中。诺尔康专门组建了一支团队,研究音频处理相关的技术。 不巧的是,当时国内智能音箱赛道成为风口。二者涉及的底层语音处理技术有相似之处。这支团队的成员不少被其他公司挖走了。 于是,该团队主要负责人,诺尔康神经刺激科学重点企业研究院副院长黄穗萌生了一个想法,「与其自己组建团队,是不是可以找大公司里成熟的技术团队合作。」 他尝试找了一家中国头部的互联网公司,结果压根没得到回复。接着,又联系上了一家擅长语音处理的技术公司,起初一切都很顺利,谈到最后对方问「能出多少钱」,黄穗只能答复「经费有限」。 最终,腾讯会议的天籁实验室找到他们进行合作,开启了一场将科技捐出去的公益实验。 

采写|万鸣宇

编辑|北方

用科技重塑听觉系统

由于先天基因突变导致双耳失聪,13 岁那年,阳光决定接受一场人工耳蜗植入手术。

那是他人生中第一次做手术,在 2003 年。那时,做这项手术的人并不多,1995 年,中国才有第一位人工耳蜗植入者。

见阳光面色苍白、紧攥着拳头,麻醉师走过来安慰。阳光听不见,她就在纸上写「没事的,不要害怕,不会痛的」。一个面罩扣在了他的脸上,吸入式麻醉后,阳光失去了意识。

阳光从小父母离异,由爷爷奶奶抚养长大。两岁时,家人发现阳光不像别的孩子听见大动静会吓得哭闹,而是对声音完全没有反应。经医院诊断,确定为神经性耳聋。

医生当时的建议是佩戴助听器。阳光记得,这是个烟盒形状的设备。每天早晨起床,奶奶会把盒子上长长的线插进他的耳朵,再把盒子放在他衣兜里。

对他的情况而言,助听器只是将外界的音量放大,效果却并不好。各种「轰隆隆」的声音一齐涌入,淹没了人声,像他这样的重度听障者还是无法听清。

碰到突然出现的巨大声响,阳光还会感觉「眼睛晃了一下」,或是「脑袋晕了一下」。这在专业术语里叫「眼震」。

「盒式助听器」外观图|网络

助听器无法完全实现阳光的听力重建。但爷爷奶奶并没放弃。他们去到北京求医。看过阳光的病理报告和片子后,医生的结论是,可以做人工耳蜗手术,这是最后的机会。

一场人工耳蜗植入手术大致分为三步:

医生会在患者右耳后三指宽的位置切一个约 3 厘米的口子,让颅骨完全暴露;

用电钻在颅骨表面磨出合适大小的骨槽,固定好植入设备;

找到耳内乳突部位,开个小孔,让植入设备的电极沿着盘旋的蜗轴,完全进入耳蜗。

人工耳蜗的构造图|中国聋人网

4 个小时,阳光的手术完成了。

醒来时,爷爷奶奶、主治大夫、护士围在病床前。

此时,阳光的耳朵还是没有声音。要再过一个月,等手术造成的创面完全愈合,植入的人工耳蜗才能开机运转;接着是可能持续一年的不定期的调机,这需要根据患者的听力状况和使用情况,在医生的辅助下,将人工耳蜗调整到适配状态。

至此,科技终于帮阳光重塑了他原本缺失的听觉系统。

让听障者,无障碍接入移动互联网

一个人工耳蜗包含两部分,除了包含电极的植入设备,还有佩戴在体外的言语处理装置。二者通过磁力吸附在一起。

体外机将声音转换为一定编码形式的电信号并传入体内,通过植入设备在电极上产生人工电信号直接刺激听神经,以此重建听障者的听觉功能。

第一次见阳光的朋友,多半会好奇别在他右耳后方的装置是什么。他会耐心地向对方解释这套体外设备。就在做手术的位置,硬币大小的圆形装置紧贴他的头皮,右耳上还挂着一个方形的小设备。

佩戴人工耳蜗的阳光

1969 年,世界上第一款可穿戴式的人工耳蜗在美国问世。这些年,作为治疗重度和极重度听力障碍最有效的方法,这项技术开始被中国的听障者认知、接纳。

与此同时,人工耳蜗开始变得轻薄化、自动化,算法和人工智能在其中的作用更加被放大。科技也在试图让听障者的生活无障碍化。

黄穗也是参与进程的一员。今年九月,他和团队研发出了中国第一款能够直接连接手机的人工耳蜗产品。

黄穗给人一种典型工科男的感觉,说话严谨。他供职于国产人工耳蜗品牌诺尔康,最早在诺尔康的美国研发中心工作。2014 年,受诺尔康 CEO 李楚邀请,他回国工作,参与诺尔康神经刺激科学重点企业研究院的筹备,此后成为该研究院的副院长。

随着科技进步,听障者的需求被进一步满足了。最早,听障者用助听器能听到些声响就很满足,后来有了人工耳蜗,实现了从「听见」到「听清」的跨越。接下来,科技还能为听障者做些什么?

人工耳蜗植入体部分示意图|诺尔康

结合当时研究领域的最新趋势,回国后,黄穗为自己的工作设定了几个目标,其中就包括开发新一代人工耳蜗及其配套系统,将无线蓝牙和自动场景切换等技术运用到相关产品中。

让人工耳蜗直连手机,是实现这些目标的核心功能点之一。

对正常人来说,这个功能很小,小到甚至有人质疑开发它的必要性。但在手机已经成为人类五官之外「第六电子感官」的今天,听障者使用手机的时间与频次都在增加。这时,听力限制妨碍了他们与手机的交互。

比如用手机看视频,把音量开到很大,也能听清——但在公共场合这将妨碍他人。如果在手机和人工耳蜗之间插上一个转接器,就能将手机的声音信号传输到人工耳蜗里这——可这样出门就得戴两个设备,也不方便。

在黄穗看来,在人工耳蜗体外设备中加入蓝牙功能,使其能与手机无线直连,更意味着「听障者终于能完全无障碍接入移动互联网」。

与「枯燥」对抗,与「问题」对抗

类似的技术其实早就出现了。 

2015 年,全球最大的人工耳蜗研发制造公司科利耳实验了一个可以跟苹果手机直连的耳蜗设备。之后,行业针对相关功能的跟进与迭代却没有想象中积极。 

普遍的顾虑是,用蓝牙直连手机会提高产品功耗,降低使用时长。对人工耳蜗用户来说,设备一旦在使用过程中出现断电停机情况,就可能听不到任何声音。很多公司为了安全和可靠性,放弃了便捷性。 

此外,与消费电子产品快速上线、高频迭代的节奏不同,医疗器械在立项初期得做理论验证,在研发制作时得做大量临床实验,正式上市前还做好充足的资质申请,不仅流程繁琐,而且周期漫长。 

为了成功研制出直连所有手机的人工耳蜗,黄穗和团队花了六年时间。黄穗用「枯燥」形容这些属于研发的日子。在实验室里,你得一次又一次,一遍又一遍与「枯燥」对抗,与「问题」对抗。

首当其冲的问题,是如何将包括蓝牙在内的多种功能集成在面积有限的电路板上。为此,他们特地组建了一支团队自研芯片。他们将自研的体外机芯片与蓝牙芯片一起,集成到面积只有硬币大小的电路板上,配合结构设计和其他元器件的封装,最终保证产品重量在 5g 左右。 

诺尔康第三代人工耳蜗体外机|诺尔康

为了解决直连蓝牙产生的功耗问题,他们找到上海交大的相关团队进行技术合作,一同开发医疗级的低功耗蓝牙传输技术。

直连手机后,正常的使用效果是,用户不仅能听到蓝牙传输的声音,也能听到耳蜗麦克风等其他通路的声音。如何保证蓝牙传输的声音信号与其他信号同步和避免串扰,也是亟待攻克的难点。

光是完成这些理论验证,就花了两年多。直到 2016 年,黄穗和团队才开始产品原型机的研制。 

技术性的问题,通过勤勉的科研求索终归可以找到答案。某种意义上,这些是自我能够掌握主动权的问题。然而,一些非技术性问题的出现却让黄穗有些苦恼。 

就在他着手研发新一代人工耳蜗产品时,国内智能音箱领域也迎来了爆发。二者涉及的底层语音处理技术有相似之处。 

黄穗一手组建的研发团队当时被其他大公司严重挖墙脚。「可能人刚招过来一年,研发稍有起色,就被挖走了」。 

为了解决这个非技术难题,黄穗想到,「与其自己组建团队,是不是可以找大公司里成熟的技术团队合作。」他尝试找了一家中国头部的互联网公司,结果压根没得到回复。 

通过相熟朋友,他又联系上了一家擅长语音处理的技术公司。起初一切讨论都很顺利,谈到最后,对方问「能出多少钱」,黄穗只能无奈地答复「我们经费有限」。

拿着锤子找钉子,将科技捐出去 

准确来说,黄穗寻求的合作是「用科技做公益」,合作双方无偿开放自己的优势能力,共同研发新一代人工耳蜗的产品和技术,推动听障者生活的无障碍化。

这对合作伙伴要求其实很高。对方不仅技术实力得过硬,在团队价值观层面还必须相信这件事的意义。黄穗做好了打持久战的准备。他一边组建自己的研发团队,一边保留着合作念想。

黄穗不知道,有一支团队同样在为寻找公益伙伴发愁。腾讯天籁实验室成立于 2020 年,是腾讯会议旗下专注于音频通信技术前瞻性研究的团队。

腾讯天籁实验室总经理商世东回忆,在与听障人群的多次接触中,团队了解到,一些听障人群虽然安装了人工耳蜗,但在机场、商场等比较嘈杂的公共环境中,依然面临「听不清」的困扰。

腾讯天籁实验室总经理商世东|腾讯会议

对于这些情况,他们当时隐约感觉自己沉淀多年的音频处理技术可以解决这些问题,只是哪些技术合适,通过怎样的产品功能解决,他们却不清楚。

就像拿着锤子找钉子,2020 年初,他们联络了多家人工耳蜗厂商,对方要么是研发能力不足,要么是开发需求不匹配。后来经人介绍,他们找到了黄穗。

当时,黄穗关于场景识别技术的研究遇到了瓶颈。第一次见面,他最开始只是试探性地询问,「能不能在提高识别成功率上帮帮忙」。没想到话匣子一下就打开了。

「腾讯会议也有开发场景识别技术。」

「那涉及复杂环境下声音的降噪技术呢?」

「这个技术点也可以开放……」

聊着聊着,双方都有些兴奋,当天就定下了两个合作方向:除了场景识别技术,还希望开发一款 App,利用手机更强大的处理能力,对采集到的语音信号进行预处理,再通过蓝牙传输到人工耳蜗,改善听觉效果。

腾讯天籁实验室与诺尔康的合作方案

腾讯天籁实验室总经理商世东告诉极客公园(ID:geekpark),这场合作中最难的部分,是思考如何将技术能力、行业经验、用户体验真正结合在一起,「其中有许多未知和不可控。」 

最直接的体现在于,腾讯天籁实验室的技术没法直接复用,必须针对听障者的使用习惯、听觉限制等情况做优化。

比如,降噪算法的优化。

商世东回忆,针对环境声的降噪需求,团队就想,是不是把噪声降到最低,给听障用户一个最纯净的声音体验,才是最好的。按照这个想法,他们给黄穗提供了一版算法。

拿到算法,黄穗将其加入到正在研发的软件中,并给到用户实验。用户的反馈却不尽如人意,不少人表示,这种声音太失真了,听着很不舒服。

腾讯天籁实验室这边才意识到:「过度降噪却可能导致声音结构的损失,带来失真的听觉体验。」于是再次针对算法进行优化,最终实现了降噪和声音保真的平衡。

把做公益的理想,落实到细节

在这场公益合作中,黄穗像是一个产品经理,他在一线与听障用户接触,挖掘问题,收集需求,形成可行的产品方案。

腾讯天籁实验室则像是研发,收到产品需求后,在自己的技术武器库中挑选出成熟的趁手的进行打磨改造,最终实现技术的公益转化。

每当跟腾讯天籁实验室有重要对接时,黄穗心里都「挺忐忑的」。

黄穗回忆,第一次见面前:「对腾讯的技术实力不担心,就是不知道他们合作的诚意有多少,开放的程度有多大」。后来聊得很契合,一颗悬着的心才放下了大半。

随着合作的深入,让黄穗忐忑的点则在于腾讯是否有持续做这件事的驱动力。毕竟,这项工程耗时费力,腾讯团队本身也有自己的主营业务。

腾讯天籁实验室这边,所有同事都是兼职参与。不同技术在使用的过程中要对接不同的算法工程师。他们每隔一两个礼拜就要开会碰一次。

黄穗说,「腾讯内部每个团队都很积极在推动这次合作。他们有时候还会来问我们的进展。他们也真的在不计成本地和我们对接调试,直到产品有了最佳状态。」

持续投入最终给到了这次公益尝试正反馈。

黄穗提到一个最直接的效果,就是提高人效,避免在研发上重复造轮子。「算法训练是腾讯天籁实验室的强项,他们可能一两天就能把算法训练得很好。如果我们自己做,还要专门招聘一个工程师,成本非常高。」

       诺尔康神经刺激科学重点企业研究院副院长黄穗|腾讯会议

数据显示,在中国,听力言语残疾人口达到 2780 万,每 1000 个新生儿中,就有 1-3 个像阳光这样是先天性耳聋患儿。可他们中的大多数都没有机会通过人工耳蜗重拾听觉。

费用太贵了。2003 年,阳光的手术费就超过 20 万,当时只有进口品牌可选。为了让阳光打消顾虑,爷爷奶奶从来没跟他提过钱的事情。如今,国产人工耳蜗的费用在 8 万左右,进口产品则是 10 万年到 30 万不等,也有更贵的。

所以,降本增效带来的更大利好,是可能用更低的价格,让听障者体验到功能更全面、更先进的人工耳蜗产品。 

2021 年 9 月 26 日,这天是国际聋人日,腾讯天籁实验室联合中国聋人协会、腾讯公益慈善基金会等机构,在深圳举办了「天籁行动」升级发布会。

天籁行动发起于一年前,旨在向公益开发者、设备厂商、NGO 等机构免费开放腾讯会议的天籁音频 AI 技术,解决听障群体的无障碍问题。与诺尔康公司的公益合作,也成为了这个行动的一部分。

这天,黄穗作为嘉宾上台分享,展示包含直连手机功能的新一代人工耳蜗产品。

在二十分钟的演讲里,他用一段视频展示了一位听障者如何通过蓝牙将耳蜗与手机直连,连接后又是如何便捷地打电话、刷视频,就像正常人一样。

接着,黄穗说,「这个功能其实早就该做,只是我们把这步迈出去了。」 

「我想听见完美的声音」

为了寻找声音,13 岁的阳光也迈出了勇敢的一步。

那时,互联网还不发达,他没法查到关于植入人工耳蜗更多的信息,不清楚这可能会有什么后遗症。他害怕,但他太渴望恢复听觉了,太渴望知道完美的声音是怎样的。于是,他决定做手术。

实际上,佩戴人工耳蜗只是开始,听障者要想实现从「听见」到「听懂」,还必须长期的康复训练。

阳光的职业身份其实是一名从业十年的听力康复师。他每天的工作从早上八点半开始,一直到晚上十点多才结束,大概每一个小时辅导一位听障者。 

阳光最小的学生十岁,最大的六十多岁,主要是培养他们的听觉习惯,教他们如何发声。每个人的情况都不一样,需要有针对性地训练。康复周期从半年到一年不等。 

有的孩子先天性失聪,因为种种原因直到上学才植入人工耳蜗。这样的小朋友可能不清楚如何正确发音,不知道什么声响对应的语义是什么。这些都需要康复师言传身教。

正在进行康复指导的阳光

阳光有时会让孩子摸着他的喉咙,感受发音时吞吐气息的状态,接着一个词汇,一遍、两遍,甚至是十遍的重复。家人有时也得陪在身边一起学习。

这是听障者重建语言能力的过程,是一个漫长的需要反复训练积累听觉阅历的过程。有学员跟阳光说,太难了,想放弃。也有学生说过,没意思,不想活了。

这个枯燥与反复的康复过程,科技能有什么办法优化它么?黄穗提到了音频技术领域的研究趋势,「如何将人的感知与算法更有效的结合。」 

他举了个例子,正常人之间的耳语,悄悄话,对听障者而言,可能很难识别到其中的情感含义。过去,我们从言语识别率和声音质量来考核一款人工耳蜗的优劣。未来,除了准确识别,能否利用技术,为听障者解析出更多声音里的体验,才更重要。 

每次听到学员说出消极的话,阳光就会想起自己的康复经历,想到「康复本身是没有失败的,但是你放弃了,就太可惜了。」

阳光还记得正式开机那天,面对调机师,自己也很害怕。但当他听到一些动静,害怕就被好奇取代了。他看到医生在说,「已经给你开机了」,接着开始拍手,跺脚,给阳光做听力测试。

他示意调机师多制造些动静,他想听到更多不同的声音,他也想把这种新世界被打开的感觉告诉爷爷奶奶。阳光看到他们都在哭。那一刻,他意识到:

「我能听见了。」

「这是我以前从来没想过的事情。」

「我以为,我这辈子就这样了。」

编者按:

如果说二十年前的互联网还是一个襁褓中的婴儿,高速发展过后,科技互联网已经成为一个肌肉发达的年轻人——人们从向往、希冀到警惕,甚至恐惧它的巨大力量——科技除了在欢快的奔跑中改造着旧世界,也迎来了需要对新世界承担更多责任的时代。

科技不应该只是一次次精准推送、一个个创造时间黑洞的消费产品,其使命也不该是无限的「增长游戏」和对用户数据的「竭泽而渔」,而应该回到「人」本身。

极客公园不只关注「新科技」,也关注「心科技」——Tech with Heart

我们找到一些团队和人,他们正利用科技的手段、创新的方式,创造着对社会更高的「ROI」。

这是「心科技」策划的第八篇。

头图来源:视觉中国

本文由极客公园 GeekPark 原创发布

  • 发表于:
  • 原文链接http://www.geekpark.net/news/290630
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券