前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Python实时语音识别

Python实时语音识别

作者头像
龙哥
发布于 2019-09-05 08:20:01
发布于 2019-09-05 08:20:01
20.6K1
举报
文章被收录于专栏:Python绿色通道Python绿色通道

最近自己想接触下语音识别,经过一番了解和摸索,实现了对语音识别API的简单调用,正好写文章记录下。目前搜到的帖子里,有现成的调用百度语音API来对音频文件进行识别的;也有通过谷歌语音服务来实现了实时语音识别的。由于我这谷歌语音一直调用不成功,就将二者结合,简单实现了通过百度语音API来进行实时语音识别。

语音识别

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,微信中将语音消息转文字,以及“Hi Siri”启用Siri时对其进行发号施令,都是语音识别的现实应用。

语音识别API

百度语音识别通过REST API的方式给开发者提供一个通用的HTTP接口。任意操作系统、任意编程语言,只要可以对百度语音服务器发起http请求,均可使用此接口来实现语音识别。调用API的流程在百度语音官方文档中有说明。

语音识别步骤

  1. 先注册百度云的账号,控制台中创建百度语音的应用,获取API Key和Secret Key
  2. 通过API Key 和 Secret Key获取token
  3. 将token和本地音频数据上传到API链接
  4. 根据API返回结果获取解析后的文字结果

注意上述过程中我们是使用的本地音频数据,那么我们如何将自己的语音转为相应的数据呢?只要调用麦克风记录我们的语音信息存为wav格式的文件即可。而实时语音识别,即一直保持检测麦克风,只要有声音就生成wav文件向API发送请求;当识别不到语音信息时,自动停止。

代码中我参考了调用谷歌语音的 speech_recognition 模块,因为它调用麦克风的命令特别简单,而且会根据检测麦克风结果自动结束录音。

需要通过pip install SpeechRecognition 下载 speech_recognition 模块来实现上述录音工作。

效果展示

语音识别结果如下图:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python绿色通道 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
可以看一下代码吗
可以看一下代码吗
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
九十六、Python只需要三十行代码,打造一款简单的人工语音对话
1876年,亚历山大·格雷厄姆·贝尔(Alexander Graham Bell)发明了一种电报机,可以通过电线传输音频。托马斯·爱迪生(Thomas Edison)于1877年发明了留声机,这是第一台记录声音并播放声音的机器。
润森
2022/08/18
9860
九十六、Python只需要三十行代码,打造一款简单的人工语音对话
【教程】极简Python接入免费语音识别API
语音识别(speech recognition)技术,也被称为自动语音识别(英语:Automatic Speech Recognition, ASR)、电脑语音识别(英语:Computer Speech Recognition)或是语音转文本识别(英语:Speech To Text, STT),其目标是以电脑自动将人类的语音内容转换为相应的文字。与说话人识别及说话人确认不同,后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
小锋学长生活大爆炸
2024/05/28
7220
从不温不火到炙手可热:语音识别技术简史
【导读】语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状,并分析一些未来趋势,希望能帮助更多年轻技术人员了解语音行业,并能产生兴趣投身于这个行业。
AI科技大本营
2019/08/23
1.6K0
从不温不火到炙手可热:语音识别技术简史
昇腾AI行业案例(七):基于 Conformer 和 Transformer 模型的中文语音识别
欢迎学习《基于 Conformer 和 Transformer 模型的中文语音识别》实验。本案例旨在帮助你深入了解如何运用深度学习模型搭建一个高效精准的语音识别系统,将中文语音信号转换成文字,并利用开源数据集对模型效果加以验证。
AI布道Mr.Jin_2025
2025/01/20
430
从零开始搭建一个语音对话机器人
最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其中包含了很多算法的演变,目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法,其中RNN扮演了非常重要的作用,深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统,从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现,发现语音识别的效果没有写的那么好,其中如果要从零来训练自己的语言模型势必会非常耗时。
好好学java
2019/08/23
11.7K1
从零开始搭建一个语音对话机器人
Linux下利用python实现语音识别详细教程
语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步,可以识别多个讲话者,并且拥有识别多种语言的庞大词汇表。 语音识别的首要部分当然是语音。通过麦克风,语音便从物理声音被转换为电信号,然后通过模数转换器转换为数据。一旦被数字化,就可适用若干种模型,将音频转录为文本。 大多数现代语音识别系统都依赖于隐马尔可夫模型(HMM)。其工作原理为:语音信号在非常短的时间尺度上(比如 10 毫秒)可被近似为静止过程,即一个其统计特性不随时间变化的过程。 许多现代语音识别系统会在 HMM 识别之前使用神经网络,通过特征变换和降维的技术来简化语音信号。也可以使用语音活动检测器(VAD)将音频信号减少到可能仅包含语音的部分。 幸运的是,对于 Python 使用者而言,一些语音识别服务可通过 API 在线使用,且其中大部分也提供了 Python SDK。
全栈程序员站长
2022/07/23
2.7K0
Linux下利用python实现语音识别详细教程
python语音识别
语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
py3study
2018/08/03
17.6K3
python语音识别
小程序与语音识别技术的结合
随着人工智能技术的不断发展,语音识别(Speech Recognition)已成为一种重要的人机交互方式。语音识别技术能够将用户的语音转换成文本,广泛应用于智能语音助手、客服系统、搜索引擎等多个领域。微信小程序作为一项便捷的移动互联网技术,能够与语音识别技术结合,为用户提供更加自然、高效的交互体验。
LucianaiB
2025/02/10
1200
使用浏览器语音API实现语音识别功能
在当今数字化浪潮汹涌澎湃的时代,语音交互技术犹如一颗璀璨的明星,在人机交互的星空中闪耀着独特的光芒。从我们日常生活中无处不在的智能语音助手,如Siri、小爱同学和小艺,到各种设备上便捷的语音控制功能,语音识别技术已经深度融入了我们的生活。
Front_Yue
2025/01/07
2190
使用浏览器语音API实现语音识别功能
python语音识别终极指南
译者 | 廉洁 编辑 | 明明 【AI科技大本营导读】亚马逊的 Alexa 的巨大成功已经证明:在不远的将来,实现一定程度上的语音支持将成为日常科技的基本要求。整合了语音识别的 Python 程序提供了其他技术无法比拟的交互性和可访问性。最重要的是,在 Python 程序中实现语音识别非常简单。阅读本指南,你就将会了解。你将学到: •语音识别的工作原理; •PyPI 支持哪些软件包; •如何安装和使用 SpeechRecognition 软件包——一个功能全面且易于使用的 Python 语音识别库。
AI科技大本营
2018/04/26
4.4K0
python语音识别终极指南
腾讯云实时语音识别-iOS SDK
AppID、SecretID 和 SecretKey等个人信息填入,否则无法运行Demo(需要在语音识别控制台开通服务,并进入API 密钥管理页面新建密钥,生成 AppID、SecretID 和 SecretKey)
许岳操
2020/07/20
11.7K0
腾讯云实时语音识别-iOS SDK
玩转AI新声态 | 我将王者荣耀的ASR语音识别,接入到了腾讯元器小程序...
刚结束了腾讯云BI的体验活动,在文章提到了SaSS、PaSS的概念,腾讯云BI是一个SaSS,而今天要写的腾讯云语音识别就是一个PaSS,平台即服务,用户只需要调用接口就能实现语音识别的功能,而语音识别所需要的算法、计算资源都是PaSS来分配。
叫我阿柒啊
2024/06/30
3960
玩转AI新声态 | 我将王者荣耀的ASR语音识别,接入到了腾讯元器小程序...
Python终级教程!语音识别!大四学生实现语音识别技能!吊的不行
语音识别源于 20 世纪 50 年代早期在贝尔实验室所做的研究。早期语音识别系统仅能识别单个讲话者以及只有约十几个单词的词汇量。现代语音识别系统已经取得了很大进步,可以识别多个讲话者,并且拥有识别多种语言的庞大词汇表。
猫咪编程
2018/07/18
2.3K0
学界 | 一文概览语音识别中尚未解决的问题
选自Awni 机器之心编译 参与:Nurhachu Null、路雪 深度学习应用到语音识别领域之后,词错率有了显著降低。但是语音识别并未达到人类水平,仍然存在多个亟待解决的问题。本文从口音、噪声、多说话人、语境、部署等多个方面介绍了语音识别中尚未解决的问题。 深度学习被应用在语音识别领域之后,词错率有了显著地降低。然而,尽管你已经读到了很多这类的论文,但是我们仍然没有实现人类水平的语音识别。语音识别器有很多失效的模式。认识到这些问题并且采取措施去解决它们则是语音识别能够取得进步的关键。这是把自动语音识别(
机器之心
2018/05/10
1K0
基于树莓派的语音识别和语音合成
语音识别技术即Automatic Speech Recognition(简称ASR),是指将人说话的语音信号转换为可被计算机程序所识别的信息,从而识别说话人的语音指令及文字内容的技术。目前语音识别被广泛的应用于客服质检,导航,智能家居等领域。树莓派自问世以来,受众多计算机发烧友和创客的追捧,曾经一“派”难求。别看其外表“娇小”,内“心”却很强大,视频、音频等功能通通皆有,可谓是“麻雀虽小,五脏俱全”。本文采用百度云语音识别API接口,在树莓派上实现低于60s音频的语音识别,也可以用于合成文本长度小于1024字节的音频。 此外,若能够结合snowboy离线语音唤醒引擎可实现离线语音唤醒,实现语音交互。
全栈程序员站长
2022/09/13
4.1K0
玩转腾讯云语音识别
随着互联网时代的进步,智能产品逐渐配备了更加多元化的功能应用、更加丰富的内容资源,用户在使用语音相关的功能时,越来越多的需求需要向智能产品用户提供更便捷的操作体验,语音转换成文本,语音识别是人工智能领域极为重要的前沿技术,实现快速、高效、准确的语音识别及控制,实现智能行业内全新的便捷操作模式。
用户10585271
2024/05/22
1.4K2
玩转腾讯云语音识别
小程序与语音识别技术的结合
语音识别技术(Speech Recognition)是人工智能的重要应用之一,能够将语音信号转化为计算机可理解的文本信息。随着智能硬件和移动互联网的发展,语音识别技术的应用场景越来越广泛,尤其在微信小程序中,语音识别的结合为用户提供了更加便捷的交互方式。无论是语音输入、语音控制,还是语音搜索,语音识别技术都在提升用户体验和操作效率方面发挥着重要作用。
LucianaiB
2025/02/10
1180
语音识别基础学习与录音笔实时转写测试
小编所在项目中,C1、C1Pro、C1Max录音笔,通过BLE和APP连接,音频文件实时传输到录音助手App端,具备实时录音转写的功能。工欲善其事必先利其器,小编补习了语音识别相关基础知识,对所测试应用的实时转写业务逻辑有了更深的认识。希望对语音测试的小伙伴们也有所帮助~~(●—●)
用户5521279
2020/11/02
2.9K0
语音识别基础学习与录音笔实时转写测试
让 Agent 具备语音交互能力:技术突破与应用前景(16/30)
在当今数字化时代,人机交互方式正经历着深刻的变革。从早期的命令行界面到图形用户界面,再到如今日益普及的语音交互,人们对于与机器沟通的便捷性和自然性有了更高的追求。Agent 作为一种能够自主执行任务、与环境进行交互的智能实体,赋予其语音交互能力具有重要的现实意义和广阔的应用前景。这不仅可以提升用户体验,使人们能够更加自然、流畅地与 Agent 进行沟通,还能拓展 Agent 的应用场景,如智能家居、智能客服、智能车载系统等领域,让智能服务更加贴近人们的生活和工作。
正在走向自律
2025/01/02
1420
让 Agent 具备语音交互能力:技术突破与应用前景(16/30)
听懂未来:AI语音识别技术的进步与实战
在人工智能的辉煌进程中,语音识别技术无疑占据了一个至关重要的地位。从最初的简单命令识别到今日能理解复杂语境的智能助手,语音识别技术已经深入人类生活的各个角落。它不仅改变了我们与机器交流的方式,更开启了一个全新的互动时代。
TechLead
2023/11/22
6700
听懂未来:AI语音识别技术的进步与实战
推荐阅读
相关推荐
九十六、Python只需要三十行代码,打造一款简单的人工语音对话
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文