腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AI科技大本营的专栏

专栏作者

3088

文章

3143325

阅读量

201

订阅数

GitHub标星近10万：只需5秒音源，这个网络就能实时“克隆”你的声音

语音识别语音合成编程算法

本文中，Google 团队提出了一种文本语音合成（text to speech）神经系统，能通过少量样本学习到多个不同说话者（speaker）的语音特征，并合成他们的讲话音频。此外，对于训练时网络没有接触过的说话者，也能在不重新训练的情况下，仅通过未知说话者数秒的音频来合成其讲话音频，即网络具有零样本学习能力。

AI科技大本营

2019-11-14

11.6K0

从不温不火到炙手可热：语音识别技术简史

NLP 服务语音识别语音合成深度学习

【导读】语音识别自半个世纪前诞生以来，一直处于不温不火的状态，直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高，虽然还无法进行无限制领域、无限制人群的应用，但也在大多数场景中提供了一种便利高效的沟通方式。本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状，并分析一些未来趋势，希望能帮助更多年轻技术人员了解语音行业，并能产生兴趣投身于这个行业。

AI科技大本营

2019-08-23

1.5K0

速度提升270倍！微软和浙大联合推出全新语音合成系统FastSpeech

语音合成 https 网络安全

【编者按】目前，基于神经网络的端到端文本到语音合成技术发展迅速，但仍面临不少问题——合成速度慢、稳定性差、可控性缺乏等。为此，微软亚洲研究院机器学习组和微软（亚洲）互联网工程院语音团队联合浙江大学提出了一种基于Transformer的新型前馈网络FastSpeech，兼具快速、鲁棒、可控等特点。与自回归的Transformer TTS相比，FastSpeech将梅尔谱的生成速度提高了近270倍，将端到端语音合成速度提高了38倍，单GPU上的语音合成速度达到了实时语音速度的30倍。

AI科技大本营

2019-06-10

5970

微软提出极低资源下语音合成与识别新方法，小语种不怕没数据！| ICML 2019

语音识别语音合成机器学习神经网络深度学习

编者按：目前，人类使用的语言种类有近7000种，然而由于缺乏足够的语音-文本监督数据，绝大多数语言并没有对应的语音合成与识别功能。为此，微软亚洲研究院机器学习组联合微软（亚洲）互联网工程院语音团队在ICML 2019上提出了极低资源下的语音合成与识别新方法，帮助所有人都可以享受到最新语音技术带来的便捷。

AI科技大本营

2019-05-22

1.5K0

妈耶，摆脱机器音，二次宅的歌姬女友彻底活了

最近，一家日本公司展示了他们在虚拟歌姬上使用的新开发语音合成技术，效果惊艳，几乎听不出虚拟歌姬歌声中那“面瘫”式的机械音，现在的歌声有起承转合，有气息声，更有力度，能让你在脑海中自然脑补它的表情。

AI科技大本营

2018-12-28

5210

没有更多了

社区活动

RAG七天入门训练营

鹅厂大牛手把手带你上手实战

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态