1. 转语音工具
微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多
记得之前看到过 Python有一个工具包,可以将文字转换为语音,支持英文和中文的同时,还能调节语速语调、导出 mp3 等音频文件
去 Github 查了下,这个依赖库叫:pyttsx3
简单来说,pyttsx3 可以文字转语音,且是离线工作的,这一点就很实用
安装比较容易,直接在命令行用 pip 安装:
我准备动手试试,将 PDF 书籍转成音频
用什么书呢?最近在群里看到有人发张磊的新作《价值》电子书,这本今年刚出的畅销书盗版猖獗,我之前在微信读书里看过,对作者长期主义的观点深信不疑
那就它了
2. PDF转文本
肯定需要先读取 PDF 中的文字,再利用 pyttsx3 转语音
Python 中操作 PDF 的工具库主要是 PyPDF2,但发现编码实在有点繁琐
我就换了另一个库 pdfplumber,它与 PyPDF2 语法类似,用起来还算流畅
pdfplumber 可以处理 PDF 包括文本、表格、格式在内的各种信息,小而强大
输出文字内容如下:
上面的代码做了几件事情:「读取 PDF 文档、读取页数、读取第 4 页、输出第 4 页文本」
3. 文本转语音
接下来开始将第 4 页的文本转化为音频
上面代码使用 pyttsx3 将文本转化为音频,然后朗读出来
我是在 jupyter notebook 上做实验的,代码执行后,电脑会直接朗读
最后,将生成的音频保存为 mp3 格式
当然,你还可以调整声音的类型、速度、大小
最后听下生成的语音是什么样的?
整体比较流畅,虽然不如微信读书语音听着那般舒服,但做做小工具还是不错的
领取专属 10元无门槛券
私享最新 技术干货