前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >太厉害了!98 秒内可以在本地转录 2.5 小时的音频!

太厉害了!98 秒内可以在本地转录 2.5 小时的音频!

作者头像
Python兴趣圈
发布2023-12-11 17:10:38
发布2023-12-11 17:10:38
58000
代码可运行
举报
文章被收录于专栏:翩翩白衣少年翩翩白衣少年
运行总次数:0
代码可运行

本文小编给大家推荐一款名为 insanely-fast-whisper 的音频转录工具,近期在 Github 上超级火🔥🔥🔥。

insanely-fast-whisper 是一款功能强大的音频转录工具,支持自动转录和说话人分割功能。具备高速转录能力,适用于大量音频处理,提高工作效率。工具核心优势在于速度,能在短时间内完成大量音频转录,节省时间和劳动力。

它底层使用 OpenAI's Whisper Large v3,适用于在 Mac 或 Nvidia GPU 上运行,并使用 Whisper + Pyannote 库加速转录和语音分段。

上线没多久,Star已达3.9K!

项目地址:http://github.com/Vaibhavs10/insanely-fast-whisper

核心特性:

1、支持说话人分割和区分,识别不同说话人,有助于分析和整理多人音频

2、自动转录,可快速将长音频文件转录为文本,无需手动逐字逐句

3、能在98秒内转录2.5小时的音频

以下是官方说明中在 Nvidia A100 - 80GB 上运行的一些基准测试:

安装使用

使用Python pip 命令可直接安装

代码语言:javascript
代码运行次数:0
运行
复制
pip install insanely-fast-whisper

执行下面命令运行:

代码语言:javascript
代码运行次数:0
运行
复制
insanely-fast-whisper --file-name <FILE NAME or URL>--batch-size 2 --device-id mps --hf_token<HF TOKEN>

注意:如果您在 macOS 上运行,还需要添加--device-id mps标志。

使用过程中常见问题

1、如何正确安装 flash-attn 使其与 insanely-fast-whisper 一起使用?

确保通过安装它pipx runpip insanely-fast-whisper install flash-attn --no-build-isolation

2、如何解决AssertionError: Torch not compiled with CUDA enabled Windows 上的错误?

这个问题的根本原因仍然未知,但是,您可以通过在 virtualenv 中手动安装 torch 来解决此问题,例如python -m pip install torch torchvision torchaudio --index-url

3、如何避免 Mac 上出现内存不足 (OOM) 异常?

mps后端没有像 CUDA 那样优化,因此更需要内存。通常,您可以--batch-size 4毫无问题地运行(应使用大约 12GB GPU VRAM)。别忘了设置--device mps.

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python兴趣圈 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 核心特性:
  • 安装使用
  • 使用过程中常见问题
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档