腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
人工智能头条
专栏成员
举报
1089
文章
1111774
阅读量
148
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
其他(317)
人工智能(314)
机器学习(239)
深度学习(217)
编程算法(182)
神经网络(128)
python(63)
大数据(60)
NLP 服务(49)
开源(41)
https(38)
机器人(34)
网络安全(31)
卷积神经网络(30)
推荐系统(27)
tensorflow(22)
github(21)
自动驾驶(20)
无人驾驶(20)
人脸识别(19)
分布式(19)
git(18)
游戏(18)
强化学习(18)
自动化(17)
图像识别(17)
数据库(16)
存储(16)
数据挖掘(15)
安全(14)
java(12)
数据分析(12)
api(11)
sql(10)
tcp/ip(9)
图像处理(8)
监督学习(8)
决策树(8)
keras(8)
物联网(8)
ide(7)
linux(7)
spark(7)
nat(7)
语音识别(6)
区块链(6)
html(6)
网站(6)
numpy(6)
线性回归(6)
pytorch(6)
windows(6)
ios(5)
apache(5)
spring(5)
腾讯云测试服务(5)
http(5)
黑客(5)
模式识别(5)
无监督学习(5)
微信(5)
数据处理(5)
汽车(5)
php(4)
javascript(4)
go(4)
云数据库 Redis(4)
搜索引擎(4)
爬虫(4)
scikit-learn(4)
数据可视化(4)
系统架构(4)
比特币(3)
mac os(3)
c++(3)
matlab(3)
机器翻译(3)
知识图谱(3)
企业(3)
容器(3)
dubbo(3)
架构设计(3)
程序员(3)
node.js(2)
android(2)
arm(2)
嵌入式(2)
硬件开发(2)
unix(2)
ubuntu(2)
nginx(2)
容器镜像服务(2)
文件存储(2)
医疗(2)
缓存(2)
hadoop(2)
正则表达式(2)
kernel(2)
数据结构(2)
mqtt(2)
kafka(2)
sdn(2)
Elasticsearch Service(2)
论文(2)
负载均衡(1)
iphone(1)
swift(1)
lua(1)
.net(1)
r 语言(1)
xml(1)
css(1)
ajax(1)
单片机(1)
sqlite(1)
oracle(1)
django(1)
打包(1)
vba(1)
windows server(1)
delphi(1)
容器服务(1)
NAT 网关(1)
消息队列 CMQ 版(1)
数据加密服务(1)
物联网通信(1)
mongodb(1)
营销风控(1)
政务云专区(1)
渲染(1)
智能硬件(1)
数据安全(1)
yarn(1)
kubernetes(1)
devops(1)
运维(1)
html5(1)
ssh(1)
gui(1)
面向对象编程(1)
spring boot(1)
opencv(1)
unity(1)
seo(1)
二叉树(1)
敏捷开发(1)
socket编程(1)
lamp(1)
迁移学习(1)
微服务(1)
腾讯云开发者社区(1)
processing(1)
云计算(1)
5g(1)
ascii(1)
程序人生(1)
学习方法(1)
教育(1)
apple(1)
delay(1)
facebook(1)
ip(1)
it(1)
mac(1)
next(1)
tcpdump(1)
time(1)
twitter(1)
公众号(1)
模型(1)
苹果(1)
软件工程(1)
项目经理(1)
搜索文章
搜索
搜索
关闭
AI 看唇语,在嘈杂场景的语音识别准确率高达75%
html
语音识别
神经网络
深度学习
人工智能
编译 | 禾木木 出品 | AI科技大本营(ID:rgznai100) 人们通过聆听和观察说话者的嘴唇动作来感知言语。 那么,AI 也可以吗? 事实上,研究表明视觉线索在语言学习中起着关键的作用。相比之下,人工智能语言识别系统主要是建立在音频上。而且需要大量数据来训练,通常需要数万小时的记录。 为了研究视觉效果,尤其是嘴部动作的镜头,是否可以提高语音识别系统的性能。Meta 的研究人员开发了 Audio-Visual Hidden Unit BERT (AV-HuBERT),这是一个通过观看学习和听人们说
用户1737318
2022-03-03
882
0
是什么技术让人工“智能”?
机器学习
语音识别
深度学习
神经网络
人工智能
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。
用户1737318
2019-09-12
480
0
文末送书 | 彻底了解什么是人工智能
机器学习
语音识别
深度学习
神经网络
人工智能
在计算机科学领域中,人工智能是一种机器表现的行为,这种行为能以与人类智能相似的方式对环境做出反应并尽可能提高自己达成目的的概率。
用户1737318
2019-08-23
439
0
美国「四院院士」为你实力科普深度学习
无人驾驶
自动驾驶
编程算法
语音识别
机器学习
作者:特伦斯 · 谢诺夫斯基,世界十大 AI 科学家之一,美国四大国家学院(国家科学院、国家医学院、国家工程院、国家艺术与科学学院)在世仅 3 位的“四院院士”之一,AI 会议 NIPS 基金会主席。
用户1737318
2019-04-30
675
0
说说图灵奖的深度学习「三教父」惊世贡献
神经网络
卷积神经网络
编程算法
图像处理
语音识别
2019年3月27日 ——ACM 宣布,深度学习之父 Yoshua Bengio , Yann LeCun 以及 Geoffrey Hinton 获得了2018年的图灵奖,被称为“计算机领域的诺贝尔奖”。
用户1737318
2019-04-30
655
0
语音识别现状与工程师必备技能
语音识别
深度学习
机器学习
神经网络
人工智能
作者 | 陈孝良 责编 | 胡永波 目前来看,语音识别的精度和速度比较取决于实际应用环境,在安静环境、标准口音、常见词汇上的语音识别率已经超过95%,完全达到了可用状态,这也是当前语音识别比较火热的原因。 随着技术的发展,现在口音、方言、噪声等场景下的语音识别也达到了可用状态,但是对于强噪声、超远场、强干扰、多语种、大词汇等场景下的语音识别还需要很大的提升。当然,多人语音识别和离线语音识别也是当前需要重点解决的问题。 学术界探讨了很多语音识别的技术趋势,有两个思路是非常值得关注的,一个是就是端到端的语音识别
用户1737318
2018-06-05
2K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档