站在巨人的肩膀上,零碎代码实现语音识别,Python妙不可言!

叙述

根据视频录音或者台词信息获得文字信息,然后转字幕,纯手打不说,还要去一直动脑识别,想一想这是有多可怕!

程序员肯定不能走寻常路,难道不能用Python实现音频转文字吗?接着我问了下度娘:找到了IBM 的Speech to text。

准备好你的音频,以及Python,开始吧!

第一步

第二步

点击现有服务,找到已有的服务。

点击服务名称查看详情。

第三步

Python安装SpeechRecognition包。

运行-cmd,打开命令提示符。输入pip install SpeechRecognition

出现下面这行字说明装好了。

第四步

打开Jupyter Notebook开始写代码啦!

运行这一步发现报错了?

用格式工厂转换到wav格式杰克。

转格式后把引号里的内容改成1.wav就可以运行了。

我三分钟的音频运行了30S吧。这个text,就是你音频转过来的文字了。让我们来试试:

print(text)

OK完成了,同时它支持多种语言,只需要把language变量改一下就可以实现不同语言的转换了。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180723A0TORB00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券