首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏作者
664
文章
1036729
阅读量
52
订阅数
Meta AI 推出 AV-HuBERT:一种最先进的自我监督框架,用于理解通过看到和听到人们说话来学习的语音
人工智能用于各种语音识别和理解活动,从启用智能扬声器到为失聪或有语言障碍的人设计辅助工具。然而这些语音理解算法经常在最需要它们的日常场景中表现不佳:当很多人同时说话或有很多背景噪音时。即使是先进的降噪技术也常常无法有效应对海滩旅行中的海浪声或嘈杂的街头市场背景的喧闹声。
代码医生工作室
2022-03-07
1.9K0
我监督我自己!Google AI发布用于视频的BERT模型 | 一周AI最火学术
呜啦啦啦啦啦啦啦大家好,拖更的AI Scholar Weekly栏目又和大家见面啦!
代码医生工作室
2019-09-19
5070
Kaldi拜拜!PyTorch语音工具包SpeechBrain要来了,支持多种语音任务,实现最强水准
现在,图灵奖得主、AI三巨头之一Yoshua Bengio领衔的研究机构Mila宣布,要联合英伟达、杜比、三星、PyTorch官方、IBM AI研究院等公司和机构,做一个新的开源一体化语音工具包:SpeechBrain。
代码医生工作室
2019-09-16
2.5K0
8倍提升表现:谷歌新算法,从多人对话里分清谁在发言,错误率降到2%
他们不想被传统做法困住,开发了新方法:利用语音识别,把语言学线索和声学线索搭配食用,帮助区分。
代码医生工作室
2019-08-20
3440
用深度学习构建声乐情感传感器
人类的表达是多方面的,复杂的。例如,说话者不仅通过语言进行交流,还通过韵律,语调,面部表情和肢体语言进行交流。这就是为什么更喜欢亲自举行商务会议而不是电话会议,以及为什么电话会议或发短信会优先考虑电话会议。越接近通信带宽就越多。
代码医生工作室
2019-08-20
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档