前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >多语言文本到音素转换工具phonemizer实践

多语言文本到音素转换工具phonemizer实践

作者头像
sparkexpert
发布2019-05-26 14:00:37
2.6K0
发布2019-05-26 14:00:37
举报
文章被收录于专栏:大数据智能实战

音素是语言识别领域的最小单元,文本到音素的转换是TTS任务(文本转语音)中重要的步骤之一,最近用了下python包(phonemizer),实践了下,觉得还挺有用的,因此记录一下过程。

(1) 下载源码,https://github.com/bootphon/phonemizer

(2) 进行源码的编译和查看,发现其调用的是festival and espeak/espeak-ng 两个系统的东西,即相当于提供了一个接口调用的东西。上述两种音素转换工具的区别如下:Festival provides US English phonemization with syllable tokenization, espeak endows multiple languages but without syllable boundaries.,可见espeak支持更多的语言。

(3) 利用源码进行调试,编译,简化其输入和输出,即可进行调试。

实验一:festival调用:en-->us,输入hello,得到的是美语的音素。

实验二:espeak调用:en-->us,输入hello,得到的是美语的音素。

实验三:espeak调用:fr-->fr,输入法语的“你好世界”,得到的是法语的音素。

代码语言:javascript
复制
实验三:espeak调用:spanish,输入西班牙语的“你好”,得到的是西班牙语的音素。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2018年04月16日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档