腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

相约机器人

专栏作者

664

文章

1036729

阅读量

52

订阅数

Meta AI 推出 AV-HuBERT：一种最先进的自我监督框架，用于理解通过看到和听到人们说话来学习的语音

https 网络安全语音识别神经网络深度学习

人工智能用于各种语音识别和理解活动，从启用智能扬声器到为失聪或有语言障碍的人设计辅助工具。然而这些语音理解算法经常在最需要它们的日常场景中表现不佳：当很多人同时说话或有很多背景噪音时。即使是先进的降噪技术也常常无法有效应对海滩旅行中的海浪声或嘈杂的街头市场背景的喧闹声。

代码医生工作室

2022-03-07

1.9K0

我监督我自己！Google AI发布用于视频的BERT模型 | 一周AI最火学术

https 网络安全语音识别机器人

呜啦啦啦啦啦啦啦大家好，拖更的AI Scholar Weekly栏目又和大家见面啦！

代码医生工作室

2019-09-19

5070

Kaldi拜拜！PyTorch语音工具包SpeechBrain要来了，支持多种语音任务，实现最强水准

pytorch python c++语音识别

现在，图灵奖得主、AI三巨头之一Yoshua Bengio领衔的研究机构Mila宣布，要联合英伟达、杜比、三星、PyTorch官方、IBM AI研究院等公司和机构，做一个新的开源一体化语音工具包：SpeechBrain。

代码医生工作室

2019-09-16

2.5K0

8倍提升表现：谷歌新算法，从多人对话里分清谁在发言，错误率降到2%

机器学习神经网络深度学习人工智能语音识别

他们不想被传统做法困住，开发了新方法：利用语音识别，把语言学线索和声学线索搭配食用，帮助区分。

代码医生工作室

2019-08-20

3440

用深度学习构建声乐情感传感器

https 语音识别机器学习神经网络深度学习

人类的表达是多方面的，复杂的。例如，说话者不仅通过语言进行交流，还通过韵律，语调，面部表情和肢体语言进行交流。这就是为什么更喜欢亲自举行商务会议而不是电话会议，以及为什么电话会议或发短信会优先考虑电话会议。越接近通信带宽就越多。

代码医生工作室

2019-08-20

1.2K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态