傻瓜式教学，某大学教师给学生的一份Python语音识别详细教材！

文章来源：企鹅号 - Python新世界

在不远的将来，实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是，在 Python 程序中实现语音识别非常简单。

语言识别工作原理概述

语音识别的首要部分当然是语音。通过麦克风，语音便从物理声音被转换为电信号，然后通过模数转换器转换为数据。一旦被数字化，就可适用若干种模型，将音频转录为文本。

幸运的是，对于 Python 使用者而言，一些语音识别服务可通过 API 在线使用，且其中大部分也提供了 Python SDK。

选择 Python 语音识别包

PyPI中有一些现成的语音识别软件包。其中包括：

SpeechRecognition 库可满足几种主流语音 API ，因此灵活性极高。其中 Google Web Speech API 支持硬编码到 SpeechRecognition 库中的默认 API 密钥，无需注册就可使用。SpeechRecognition 以其灵活性和易用性成为编写 Python 程序的最佳选择。

安装 SpeechRecognation

SpeechRecognition 兼容 Python2.6 , 2.7 和 3.3+，但若在 Python 2 中使用还需要一些额外的安装步骤。本教程中所有开发版本默认 Python 3.3+。

读者可使用 pip 命令从终端安装 SpeechRecognition：

识别器类

音频文件的使用

支持文件类型

使用 record() 从文件中获取数据

例如，以下内容仅获取文件前四秒内的语音：

噪声对语音识别的影响

尝试转录此文件时会发生什么？

通过把 recognition_google（）中 True 参数改成 show_all 来给出完整响应。

麦克风的使用

若要使用 SpeechRecognizer 访问麦克风则必须安装 PyAudio 软件包，请关闭当前的解释器窗口，进行以下操作：

安装 PyAudio

安装 PyAudio 的过程会因操作系统而异。

Debian Linux

如果使用的是基于 Debian的Linux（如 Ubuntu ），则可使用 apt 安装 PyAudio：

安装测试

安装了 PyAudio 后可从控制台进行安装测试。

Microphone 类

使用 listen（）获取麦克风输入数据

处理难以识别的语音

发表于: 2018-08-082018-08-08 13:57:11
原文链接：https://kuaibao.qq.com/s/20180808A0UDW800?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

傻瓜式教学，某大学教师给学生的一份Python语音识别详细教材！

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐