前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >盘点一个语音识别库报错的问题

盘点一个语音识别库报错的问题

作者头像
Python进阶者
发布2024-03-21 13:44:36
770
发布2024-03-21 13:44:36
举报

机不可失,时不再来。

大家好,我是Python进阶者。

一、前言

前几天在Python白银交流群【云何应住】问了一个Python处理语音消息识别的实战问题。问题如下:

代码语言:javascript
复制
import speech_recognition as sr #导包

r = sr.Recognizer()
mic = sr.Microphone()

with mic as source:
    r.adjust_for_ambient_noise(source)
    audio = r.listen(source)

print(r.recognize_google(audio, language='zh-CN')) #language='zh-CN'识别成中文 这段代码是语音识别的功能,用的是speechRecognition库,我运行报错,麻烦知道的朋友给处理一下,报错截图如下

二、实现过程

这里【啥也不懂】给了一个指导:

这个问题其实已经很明显了,需要魔法才行。

可以看到加了魔法,就可以顺利解决了。当然了,也有一些其他的库,如pyaudio、whisper等等,部署起来可能会麻烦一些。

后面了解到他是要给客户做个离线的产品,这里【瑜亮老师】和他交流了一些想法,受益颇丰。

甚至你可以给客户说,离线版的本身就有语音识别率的问题,会有一些识别错误。在线版的会识别率更高,看看客户是否愿意更改为联网版。先给客户一个心理暗示,让他有个准备。本身中文就有一音多字的情况,语音转文字肯定会有一些困难的。

你得让客户先有个心理准备,让他知道语音转文字会有一定的错误率,而原因就是中文的一音多字。这样客户才不会对你“精益求精”的提出很多“合理建议”(无理需求)

顺利地解决了粉丝的问题。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-03-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、前言
  • 二、实现过程
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档