首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用腾讯云 AI 录音文件识别,实现短视频字幕批量处理,1行代码搞定语音转文字

用腾讯云 AI 录音文件识别,实现短视频字幕批量处理,1行代码搞定语音转文字

作者头像
程序员晚枫
发布2022-12-09 11:07:15
发布2022-12-09 11:07:15
4.1K00
代码可运行
举报
文章被收录于专栏:自动化办公自动化办公
运行总次数:0
代码可运行

大家好,我是在重庆的Python程序员晚枫,全网同名。

经常遇到身边的朋友,想从视频中提取出文字,尤其是自媒体博主,如果能直接把视频转换成文章,那可太省时间了。

通过一阵检索,发现网上有很多付费软件可以提供视频提取语音的功能,但是价格都不低。

作为程序员,肯定不满足于付费工具的东西,正好看到腾讯云AI平台正在搞活动,1元即可购买60个小时的录音文件识别时长,另外还有多种福利的赠送,于是果断购买。福利传送门:https://url.cn/Gdlb3bId

我们来一起看一下是怎么使用的~

0、前置操作

从视频转为文字,我这里分成了2步:视频→音频→文字。

“之前给大家开发了:视频提取语音的方法,代码如下,不懂的可以翻看我之前的文章。这里就不再多介绍了。(左右滑动,查看完整代码)

代码语言:javascript
代码运行次数:0
运行
复制
# pip install office
import office

office.video.video2mp3(path=r'your_video_path', mp3_name='result')

接下来我们看一下,⭐如何使用腾讯云AI的录音识别功能,把提取出来的语音,转换成文字吧。

1、安装

这个录音识别的功能,腾讯云已经为我们写好了文档和代码,我根据这些资料,把这个转换功能,同样封装进了第三方库:povideo。所以首先需要安装这个库:

代码语言:javascript
代码运行次数:0
运行
复制
pip install python-office -U

2、使用

安装成功后,可以直接1行代码进行调用(左右滑动,查看完整代码):

代码语言:javascript
代码运行次数:0
运行
复制
import office

office.video.audio2txt(audio_path=r"your_audio_path",
                  appid='your_appid',
                  secret_id='your_secret_id',
                  secret_key='your_secret_key')

CoderWanFeng

3、参数说明

参数主要分为2部分:语音路径和app配置,

  • 语音路径:填写你语音文件的路径,本地语音文件不能大于5MB。
    • audio_path
  • app配置:开通语音识别功能后,去到这个网址进行获取:https://console.cloud.tencent.com/cam/capi
    • appid
    • secret_id
    • secret_key

4、参考资料

  • povideo的源码仓库:https://github.com/CoderWanFeng/povideo
  • 录音识别,官方说明文档:https://cloud.tencent.com/document/product/1093/37823
  • 录音识别,腾讯提供的代码:https://github.com/TencentCloud/tencentcloud-sdk-python

- END -

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-10-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python自动化办公社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0、前置操作
  • 1、安装
  • 2、使用
  • 3、参数说明
  • 4、参考资料
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档