前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >人类的意念终于能实时转化成文字,但Facebook不打算继续了

人类的意念终于能实时转化成文字,但Facebook不打算继续了

作者头像
深度学习与Python
发布2023-04-01 16:14:25
2670
发布2023-04-01 16:14:25
举报
文章被收录于专栏:深度学习与python

整理|燕珊、核子可乐

Facebook 宣布开源脑机接口软件 LabGraph,并将头戴式硬件原型分享给研究人员和其他同行,以帮助推进这一方向的探索。

Facebook 正在放弃对于脑机接口(Brain Computer Interface,简称 BCI)设备的研发,尽管近日其投资的一个相关研究项目有了实质性进展——能让患有严重失语症的人拥有“沟通能力”。

近年来,作为最前沿的技术之一,脑机接口领域的技术进展和商业化落地进展一直备受关注。但 Facebook 坦承,面向大众市场的消费级脑机接口仍然遥遥无期。与此同时,为了继续促进光学 BCI 在整个领域的发展,Facebook 宣布开放相关 BCI 软件 LabGraph 的源代码,并将头戴式硬件原型分享给研究人员和其他同行,以帮助推进这一方向的探索。

Facebook 的“读心术”

2017 年春季可能会是一段被载入史册的重要时期,当时多家大型科技企业相继发起“深入人心”的活动。首先是 Elon Musk(埃隆·马斯克)创立了脑机接口企业 Neuralink,表示正在研究如何将数千个电极植入至人类大脑当中。几天之后,Facebook 也加入了这项探索,媒体曝光 Facebook Reality Labs(FRL)旗下名为 Building 8 的秘密部门正尝试开发一款耳机或者头带,帮助用户用思维方式发送短信——输入速度可以达到每分钟 100 个单词。

根据计划,Facebook 希望让任何用户都能通过 VR 虚拟现实的方式享受这种不需要用到手的人机交互。前 DARPA 官员、时任 Building 8 硬件部门负责人的 Regina Dugan 当时兴奋地强调,“直接通过意念就能打字,听起来是不是相当奇妙?虽然难度极大,但我们获得的进展已经远超大家想象。”

不过如今看来,现实的进展并没有远超想象。在一篇博文中,Facebook 表示将停止该项目,转而将研究重点放在一款用于虚拟现实实验的手腕控制器上,这款控制器能够读取手臂的肌肉信号。该公司指出,“虽然我们对头戴式光学脑机接口的长期发展潜力仍有信心,但还是决定把精力集中在另外一种不同的神经接口之上,希望能够更快拿出可行的市场产品。”

最初,Facebook 的脑机接口(BCI)项目团队设定的长期目标是:开发一个无声、无创的语音接口,人们只需用意念去想希望说出的话语,就可以实现相应的文本输入操作。

去年才开始接手和领导“无声”语音识别项目、但最近开始转而研究 Facebook 平台选举话题管理的物理学家及神经科学家 Mark Chevillet 表示,“我们在技术层面获得了丰富的实践积累。因此我们可以自信地说,从消费级接口角度来评判,头戴式光学无声语音设备还有很长的发展道路要走,远比我们预想的要长。”

BCI 难以应用到消费级产品

Facebook 的畅想无疑是让“无声”语音项目与 VR 结合,毕竟早在 2014 年它就以 20 亿美元高价收购了 Oculus VR。Chevillet 表示,为了实现这个目标,Facebook 公司采取了双管齐下的推进方法。首先,他们需要确定意念到语音的接口是否可行。为此,Facebook 决定赞助加州大学旧金山分校的一项研究,由研究员 Edward Chang 尝试在人类大脑表面放置电极垫。

植入的电极能够从单一神经元处读取数据,这种被称为脑皮层电流描记法(简称 ECoG)的技术能够一次性对大量神经元进行测量。

这支研究团队最终取得了一系列令人惊讶的进展。根据《新英格兰医学杂志》上的报道,他们使用这些电极垫完成了实时语音解码。其中的研究对象是一位代号为“Bravo-1”的 36 岁男性,他由于严重中风而失去了正常的语言表达能力,只能勉强发出断断续续的咕哝声。在报告当中,研究员团队表示通过大脑表面的电极垫,Bravo-1 已经能够以每分钟 15 个单词的速度在计算机上表达语句。至于具体实现方式,他们会测试 Bravo-1 尝试进行默念时用于控制舌头及声道的运动皮层区域神经信号。

为了达成这样的结果,Chang 的团队给 Bravo-1 提供了 50 个常用词汇,每一个进行近万次默念,而后将患者的神经信号输入至深度学习模型。在训练模型将词汇与神经信号相匹配之后,该团队即可以 40% 的正确概率确定 Bravo-1 想要表达的词汇(远高于训练之初的 2%)。尽管如此,他的表达结果仍然充满了错误,例如把“嗨,你好吗?”理解成“黑,你吼吗?”

但科学家们决定添加一套语言模型来进一步提高性能,用于判断英语语境下哪些单词序列出现的几率更高。通过这次努力,准确率被提升至 75%。通过这种方法,系统已经能够将 Bravo-1 的表达“我稀饭我的护士”正确地调整为“我喜欢我的护士。”

但同样值得注意的是,英语这门语言共包含超过 17 万个单词,而一旦超出 Bravo-1 所掌握的词汇范畴,其性能也将直线下降。换句话说,这项技术虽然有望用于医疗援助,但与 Facebook 的最初预期仍然相去甚远。Chevillet 坦言,“在可预见的未来,这项技术应该能够实现临床辅助应用,而这跟 Facebook 的业务没什么关系。对于我们真正关注的消费级应用,目前的成果还远远不够。”

Facebook开发的漫射光学层析成像设备,使用光测量大脑中的血氧变化。

应用场景待拓展

技术发展的速度往往比应用和产品的落地要快得多。多年来,脑科学更多聚焦在基础理论探索阶段,一方面这是极为复杂的交叉性学科,另一方面该技术还未大量进入日常生活,缺乏足够市场支持。

而尽管脑机接口技术的发展面临诸多挑战,该领域还是吸引了不少科技巨头进场,除了 Facebook,Google、阿里巴巴、科大讯飞等公司也在相继布局。今年 4 月,马斯克的 Neuralink 公司宣布,能够让一只猕猴通过大脑活动来控制计算机,而无需通过手来操纵游戏杆。消息一出,脑机接口又再登上热点话题。

研究人员通过在猴子的大脑皮层区域接入 2000 多条细丝,在猴子与计算机交互的时候记录猴子大脑的神经元活动,并将这些神经元活动数据输入到“解码器算法”中,以观察并实时预测猴子的手部运动。虽然有不少业内专家认为 Neuralink 的一系列成果在脑机领域并没有什么创新,但这也侧面说明了人类对脑机接口始终充满好奇。

在众多产业中,医疗领域被视为脑机接口最先落地的方向,目前已经实现临床应用产品,功能集中在针对神经疾病的病情诊断、系统监测和辅助治疗等方面。

阿里巴巴达摩院在 2021 十大科技趋势中亦指出,脑机接口帮助人类超越生物学极限。学术界和工业界正在努力攻克脑信号的采集和处理难题,帮助人类更好地理解大脑工作原理,技术的成熟将加速脑机接口的临床应用,未来将为口不能言、手不能动的患者提供精准康复服务。

参考链接:

https://www.technologyreview.com/2021/07/14/1028447/facebook-brain-reading-interface-stops-funding/

https://www.theregister.com/2021/07/15/facebook_dumps_mindreading_neural_interface/

本周好文推荐

CentOS 8退役倒计时,开发者们又吵起来了

B站崩了:事情不大,影响不小

比贝佐斯早9天!71岁亿万富翁历经14年,终于登上太空圆梦

无代码将死,低代码长存

小米122人获1.2亿十年股股权激励,人均2440多万;字节跳动8月1日起取消大小周;原阿里钉钉CEO将离职创业 | Q资讯


 活动推荐

AICon 全球人工智能与机器学习技术大会 2021(北京站)——「推荐广告技术及实践」专场聚焦在搜索推荐和广告场景,围绕工程和算法的联合设计,给大家带来业界的最佳实践和前沿创新分享。

目前已邀请到快手、阿里巴巴、腾讯的技术专家,点击【阅读原文】或识别二维码去官网了解更多。大会门票 8 折特惠中,现在购票立减 960 元,团购还有更多优惠!购票欢迎联系票务小姐姐:13269078023(电话同微信)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 InfoQ 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
短信
腾讯云短信(Short Message Service,SMS)可为广大企业级用户提供稳定可靠,安全合规的短信触达服务。用户可快速接入,调用 API / SDK 或者通过控制台即可发送,支持发送验证码、通知类短信和营销短信。国内验证短信秒级触达,99%到达率;国际/港澳台短信覆盖全球200+国家/地区,全球多服务站点,稳定可靠。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档