站在巨人的肩膀上，零碎代码实现语音识别，Python妙不可言！

文章来源：企鹅号 - Python新世界

叙述

根据视频录音或者台词信息获得文字信息，然后转字幕，纯手打不说，还要去一直动脑识别，想一想这是有多可怕！

程序员肯定不能走寻常路，难道不能用Python实现音频转文字吗？接着我问了下度娘：找到了IBM 的Speech to text。

准备好你的音频，以及Python，开始吧！

第一步

第二步

点击现有服务，找到已有的服务。

点击服务名称查看详情。

第三步

Python安装SpeechRecognition包。

运行-cmd，打开命令提示符。输入pip install SpeechRecognition

出现下面这行字说明装好了。

第四步

打开Jupyter Notebook开始写代码啦！

运行这一步发现报错了？

用格式工厂转换到wav格式杰克。

转格式后把引号里的内容改成1.wav就可以运行了。

我三分钟的音频运行了30S吧。这个text，就是你音频转过来的文字了。让我们来试试：

print(text)

OK完成了，同时它支持多种语言，只需要把language变量改一下就可以实现不同语言的转换了。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货