首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

强到离谱的开源、免费工具:目前见过同类工具中最强的存在

EmotiVoice是一个强大的开源T擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。免费开源,功能强的离谱!

EmotiVoice

EmotiVoice(易魔声)是一款来自 GitHub 的强大开源 TTS 引擎(Text To Speech,即文本转语音)。它支持多角色多语言多种情绪的语音合成。

这款工具完全免费、无广告,支持中英文,并内置了2000多种不同的音色,适用于Windows、MacOS、Linux等平台。今天我们将重点介绍它的 Windows 本地部署包,大小约为 5.3GB。

通过 EmotiVoice,我们可以在自己的电脑上合成 2000 多种不同音色及 7 种情绪的语音,效果极为出色,带有情感,几乎可媲美真人。

每种音色(说话人)都支持自定义普通生气开心惊讶悲伤厌恶恐惧等 7 种情绪。

注意:为了达到最佳使用体验,请使用拥有 Nvidia GPU 的 PC。GPU 性能将会影响该工具的语音合成效率。

使用方法非常简单:解压软件压缩包后,双击运行【Start.bat】即可启动软件。

软件本地服务将在 CMD 命令行窗口中运行:

服务启动成功后,将会打开一个 WebUI。在此 WebUI 中,我们可以根据自己的需求开始合成语音:

选择说话人、情绪、语言后,输入合成语音所需文本,点击【合成音频】即可生成语音:

合成音频的速度取决于 GPU 的算力、GPU 的性能释放、选择的语音模型(说话人)的效率以及输入文本内容的长度。

合成成功后,我们可以在线试听合成的语音。点击语言进度条右侧的【···】即可将语音文件保存到本地(WAV 格式):

除了合成单句语音外,EmotiVoice 还支持故事剧本的多人合成。我们可以自定义剧本中各个角色的名称、语音模型、说话内容和情绪:

如果我们在使用过程中勾选了自动保存生成的语音,可以进入软件文件夹,打开wav_file文件夹查看合成的语音文件:

退出软件时,只需关闭 CMD 窗口和网页窗口(WebUI)即可。

EmotiVoice 合成的语音听起来相当不错(注意输入文本内容的标点符号),带有情绪,非常逼真。大家感兴趣的话可以下载试用!

以上就是本期的全部内容。如果你喜欢这期内容,记得「关注」、点「」、点「在看」支持一下“格物时间”,感谢大家的支持!

EmotiVoice(GitHub):https://github.com/netease-youdao/EmotiVoice

搬运:https://www.123pan.com/s/6ZFcVv-4ufzH.html

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OprO1WFR0f6WhSN2PpuGPOnw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券