首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

只需2秒样本就能克隆任何人的声音:Meta Voicebox

Meta的突破性的语音生成AI模型:Voicebox。Voicebox只需要2秒钟的语音样本,就能够克隆任何人的语音。而且文字转语音的速度比市场上其它模型快20倍,同时错误率更低。Voicebox可以在没有专门训练的情况下,进行诸如噪音消除、内容编辑、风格转换,语言转换等任务。语音内容再也不需要重录了。Voicebox所基于的是一种名为Flow Matching的方法。该方法已经被证明可以提高扩散模型的性能,超越了当前最先进的模型VALL-E1。这种技术当然带来了社会风险。想象一下,有人用你2秒钟的语音样本,恶意模仿你的声音,可能会导致什么后果?

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230621A08AFS00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券