首页
学习
活动
专区
工具
TVP
发布

人工智能头条

专栏成员
1089
文章
1111774
阅读量
148
订阅数
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 人们通过聆听和观察说话者的嘴唇动作来感知言语。 那么,AI 也可以吗? 事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部动作的镜头,是否可以提高语音识别系统的性能。Meta 的研究人员开发了 Audio-Visual Hidden Unit BERT (AV-HuBERT),这是一个通过观看学习和听人们说
用户1737318
2022-03-03
8820
是什么技术让人工“智能”?
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。
用户1737318
2019-09-12
4800
文末送书 | 彻底了解什么是人工智能
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。
用户1737318
2019-08-23
4390
美国「四院院士」为你实力科普深度学习
作者:特伦斯 · 谢诺夫斯基,世界十大 AI 科学家之一,美国四大国家学院(国家科学院、国家医学院、国家工程院、国家艺术与科学学院)在世仅 3 位的“四院院士”之一,AI 会议 NIPS 基金会主席。
用户1737318
2019-04-30
6750
说说图灵奖的深度学习「三教父」惊世贡献
2019年3月27日 ——ACM 宣布,深度学习之父 Yoshua Bengio , Yann LeCun 以及 Geoffrey Hinton 获得了2018年的图灵奖,被称为“计算机领域的诺贝尔奖”。
用户1737318
2019-04-30
6550
语音识别现状与工程师必备技能
作者 | 陈孝良 责编 | 胡永波 目前来看,语音识别的精度和速度比较取决于实际应用环境,在安静环境、标准口音、常见词汇上的语音识别率已经超过95%,完全达到了可用状态,这也是当前语音识别比较火热的原因。 随着技术的发展,现在口音、方言、噪声等场景下的语音识别也达到了可用状态,但是对于强噪声、超远场、强干扰、多语种、大词汇等场景下的语音识别还需要很大的提升。当然,多人语音识别和离线语音识别也是当前需要重点解决的问题。 学术界探讨了很多语音识别的技术趋势,有两个思路是非常值得关注的,一个是就是端到端的语音识别
用户1737318
2018-06-05
2K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档