人工智能唇语阅读能力超过人类

在数据处理和文件归档方面,机器的表现已经超过人类,如今机器还具备了唇语识别能力。

据英国《每日邮报》报道,英国一个研究团队开发了一款唇语阅读计算机程序,其能力甚至超过了人类专家。这款名为LipNet的软件由牛津大学开发,其唇语识别准确率最高达到了93.4%,经验丰富的唇语阅读者的准确率约为52%。

LipNet利用神经网络映射人类口腔运动,与语库内容一一匹配。在训练阶段,这款人工智能软件会通过视频脚本学习人发出的陌生指令,指令中带有含义模糊的短语,例如“请将蓝色设为四”。LipNet通过分解视频帧将人的口腔运动与已知指令相匹配。在测试阶段,约有2.9万段视频被用于训练人工智能,视频中的说话人为两男两女,软件会将训练结果与三名使用唇语的听障人士的准确率进行对比。

该项目由谷歌DeepMind等机构资助,其成果打破了过去79.6%的机器唇语阅读准确率纪录。但该团队表示,他们的目标是用真实案例来进行训练,项目研究人员Yannis Assael认为,只有使用更多的数据才能进一步提升表现。

该团队的研究论文已在ArXiv上发布。研究人员指出,唇语阅读器具有很大的实用价值,可用于听力辅助、公共场所的无声命令、秘密对话、在嘈杂环境中识别语音、生物识别和无声影片处理等。但Assael表示,不用担心这款软件被用于监视人们的对话,因为LipNet没法用来监控,这是因为唇语阅读需要能看到说话者的舌头——也就是说,视频画面必须是正面的,而且光线充足,才能获得良好的识别效果。

唇语识别是一项重大研究成果,进一步扩展了基于视觉的机器学习功能。实例学习这一机器学习技术可帮助计算机深入理解图像、场景等的具体含义,即使遇到的是陌生的图像或场景亦如此。

DeepMind研究人员最近通过为机器赋予记忆开发了软件的“一次性学习”能力,进一步强化了软件的理解能力。有了这种功能,系统只要对一个物体进行过学习,下一次遇到时便可自动识别。这样的进展看似微不足道,却可以大大加快人工智能系统的学习过程,让人工智能以更快的速度发展。

原文发布于微信公众号 - 人工智能快报(AI_News)

原文发表时间:2016-12-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

DeepMind用深度学习模仿大脑推理,预测编码智能推进一大步!

【新智元导读】预测编码理论认为,大脑的感知、运动控制、记忆及其他高级功能,取决于真实经历和大脑对未来的预测之间的差异。DeepMind新推出的“生成查询网络”模...

741
来自专栏AI科技评论

业界丨图像识别怎样改变AV产业?日本人表示:你们都弱爆了

AI 科技评论注:本文作者何之源,复旦大学计算机科学硕士在读,研究人工智能计算机视觉方向。本文由 AI 科技评论编辑整理自作者知乎专栏,获授权发布。 先进的图像...

4298
来自专栏新智元

《科学》封面论文作者力作:搭建像人一样思考和学习的机器(附论文下载)

【新智元导读】纽约大学的B. Lake、MIT的J. Tenenbaum等人2015年底在《科学》刊发封面论文,描述“看一眼便能学会写字”的计算机。Lake、T...

3207
来自专栏AI研习社

Hinton 谷歌大脑新作:通过给个体标签建模来提高分类能力

图片来源 oregon center for nursing AI 研习社按:Geoffrey Hinton 于 2013 年加入谷歌,目前在谷歌大脑团队致力...

33211
来自专栏人工智能头条

贾扬清:希望Caffe成为深度学习领域的Hadoop

1774
来自专栏IT大咖说

机器学习在开心词场(自适应学习)中应用

摘要 教育是最传统和复杂的社会活动,如何使用AI(机器学习)技术改造和促进人类自身学习(提高学习效率和学习效果) ,是互联网教育大数据及挖掘的基本问题;简单介绍...

3438
来自专栏null的专栏

计算广告——平滑CTR

一、广告计算的基本概念 1、广告的形式 在互联网发展的过程中,广告成为了互联网企业盈利的一个很重要的部分,根据不同的广告形式,互联网广告可以分为: 展示广告(d...

43612
来自专栏智能算法

机器视觉与计算机视觉的区别?

计算机视觉与机器视觉,首先是应用场景不一样,就像@Vinjn张静 回答的那样:你把摄像头对着人就是CV,对着车间就是MV。 计算机视觉和机器视觉应用场景不同,就...

44011
来自专栏AI科技大本营的专栏

深度学习(Deep Learning)是否已经让传统的机器学习无用了?

---- 作者: 威廉·沃海思(William Vorhies) 编译: AI100 原文地址: http://www.datasciencecentral....

2666
来自专栏PPV课数据科学社区

深度 | 地平线罗恒:应用深度学习的门槛是在降低吗?

导读: 地平线机器人资深算法研究员罗恒参加了钛坦白第33期,与百度资深工程师、Paddle API重构设计负责人于洋及第四范式联合创始人、首席研究科学家陈雨强一...

2966

扫码关注云+社区