首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用Python三步完成文本到语音的转换

重磅干货,第一时间送达

一篇文章带你了解文本到语音转换步骤

在《这篇文章》中,我们有简单提到“文本语音转换”的相关内容,本文将继续讲述其详细实现步骤。

这里小编将介绍文本到语音翻译的基础知识。简要介绍文本语音转换,然后介绍如何开始安装Google文本语音转换(gTTS)模块。然后继续了解gTTS模块的工作原理,并编写一个简单的程序以更好地掌握总体概念。最后将探索更多有关使用此模块可以完成的工作的想法,然后尝试理解可以使用gTTS完成的许多实际用例。

P.S  本文将通过互联网使用Google API进行文本到语音的翻译,所以请大家保持网络连接正常。

注意:这是语言建模教程的第一部分。在本教程系列中,我们将介绍如何使用gTTS进行语音转换,光学字符识别,深度学习模型(如序列到注意力序列模型)以及其他有趣的东西。

TTS简介

文本语音转换(TTS)是将单词转换为语音形式的过程。程序,工具或软件从用户处获取输入文本,并使用自然语言处理方法来理解所用语言的语言学,并对文本进行逻辑推断。该处理后的文本被传递到下一个块,在该块中对处理后的文本执行数字信号处理。经过一些算法的处理,最终转换为语音格式。这整个过程涉及语音的合成。下面是一个简单的流程框图,可以帮助理解上述过程。

乍一看,这似乎是一个相当复杂的过程,但是有了python和gTTS模块,该过程可以简化为仅仅几行代码。从框图中了解到,首先通过自然语言处理对传递的文本进行预处理,然后使用数字信号处理将其转换为语音。

事不宜迟,让我们快速开始~

安装gTTs模块:

在本教程的其余部分中都将使用python。请保证电脑中有安装Python哦~

gTTS模块的安装非常简单,可以在命令提示符中使用以下命令来完成:

转换:

安装完成后,我们可以继续编写一个非常简单的程序,以了解如何使用此模块将输入的文本转换为语音。来看一下我们的示例程序:

gTTS(Google文本语音转换)是一个Python库和CLI工具,可与Google的文本语音转换API进行交互。我们将从gtts模块导入gTTS库,并用该库进行语音翻译。

文本变量是用于存储用户输入的字符串。文本可以替换为引号内的任何内容。另一种方法是在每次运行程序时使用input语句让用户自己输入。上述过程可按如下方式进行:

tts变量用于对用户的输入执行Google文本到语音转换。转换后的文本以语音形式存储在tts变量中。

tts.save函数允许以声音格式文件的形式来保存转换后得到的语音。在这里保存为一个名为user_inpurt,格式为.mp3的文件。当然也可以使用其他格式,如.wav等。

经过上述步骤已成功完成文件的保存。

读取:

1. 直接从文件夹运行保存的文件:可以在运行python程序的同一文件夹下找到保存的文件,并且直接播放。

2. 使用Python中的OS模块:使用python的OS模块直接从程序中运行文件。这样做的命令如下:

3. 使用playsound模块:playsound模块可以用一个简单的命令"pip install playsound"安装,然后使用以下命令继续播放文件中的音频:

结论:

gTTS模块也可以广泛用于其他语言,例如法语,德语,印地语等。当存在通信障碍并且用户无法将其消息传达给人们时,这个模块就显得非常有用了。文字转语音对视力障碍者或其他残疾人士也有很大的帮助,因为它可以通过协助文字到语音的翻译来帮助他们。

·  END  ·

HAPPY LIFE

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201027A03JRK00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券