whisper - 腾讯云开发者社区

文章/答案/技术大牛

发布

高效音频转文本工具Whisper

大家好，我是站长可乐，今天给大家推荐的是音频转文本工具——Whisper，Whisper是由OpenAI开发的一个自动语音识别(ASR)开源系统。...OpenAI的技术文档介绍了如何基于Whisper模型调用语言转文本API来实现语言转写或将语言翻译成英文的功能。...Speech-to-text API 介绍文档 https://platform.openai.com/docs/guides/speech-to-text 这里我们先在下载好Whisper模型（下载地址请见文末...下载地址给大家准备了下载地址和模型下载地址，关注本站公众号【小轻论坛】回复关键词“ Whisper ”即可获取下载。

5621 0

whisper(音转文)使用教程

github：https://github.com/openai/whisper https://gitcode.com/gh_mirrors/whisp/whisper/overview https...://github.com/jhj0517/Whisper-WebUI 安装Whisper pip install -U openai-whisper 此外你还需要安装ffmpeg。...下载模型： Whisper提供了多种大小的模型，您可以根据需要下载。.../large-v3.pt", } 使用Whisper进行语音识别 import whisper # 加载模型 model = whisper.load_model("large-v2") # 转录音频文件...Whisper 是一个基于 CTranslate2 的 OpenAI Whisper 模型的重新实现。

6211 0

您找到你想要的搜索结果了吗？

是的

没有找到

最佳语音识别 Whisper-large-v3-turbo 上线，速度更快（本地安装 + Whisper-web）

刚刚，Openai whisper-large-v3-turbo 上线了 ......在本文中，我们将介绍 whisper-large-v3-turbo 以及 whisper-web（一个直接在浏览器中进行ML语音识别的开源项目）。...尽管近年来出现了许多音频和多模态模型，但Whisper 仍是生产级自动语音识别（ASR）的首选。...与其前身 Whisper 大型版本 3 相比，Turbo 版在解码层数上从 32 降至 4，运行速度更快，尽管质量略有下降，但差别非常小。...whisper-large-v3-turbo [3] https://www.youtube.com/watch?

4.1K1 1

Whisper 整体架构图

Whisper Whisper 整体模型。

5692 0

语音转字幕：Whisper模型的功能和使用

功能：多语言支持：Whisper模型支持99种不同语言的转录，这意味着无论音频是用哪种语言录制的，模型都能够将其识别并转录为文本。...语音翻译：除了多语言转录外，Whisper模型还能够将识别的文本从原始语言翻译为英语。这使得它成为一个强大的跨语言交流工具。...鲁棒性：Whisper模型对于口音、背景噪音和技术语言具有很好的鲁棒性，这意味着在各种不同的环境和条件下，模型都能够保持较高的识别准确率。...模型架构：Whisper模型采用了一种简单的端到端方法，利用Transformer模型的编码器-解码器结构。...效果与应用场景：Whisper模型的效果比市面上很多音频转文字的工具都要好，可以广泛应用于语音助手、语音识别和语音翻译等场景。

2.9K0 0

微调Whisper模型和加速推理

openai/whisper-tiny openai/whisper-base openai/whisper-small openai/whisper-medium openai/whisper-large...openai/whisper-large-v2 源码地址：Whisper-Finetune 使用环境： Anaconda 3 Python 3.8 Pytorch 1.12.1 Ubuntu 18.04...merge_lora.py：合并Whisper和Lora的模型。 evaluation.py：评估使用微调后的模型或者Whisper原模型。...Whisper是支持有标点符号的，所以训练的数据集中可以带有标点符号。...如下命令，--model参数指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。

2.5K3 0

Swarm和Whisper是什么鬼？

以太坊的智能合约smart contract实现了分布式逻辑，以太坊的Swarm实现了分布式存储，以太坊的Whisper实现了分布式消息，Whisper将实现智能合约间的消息互通，届时可以实现功能更加复杂的...whisper whisper是一种信息检索协议，它允许节点间直接以一种安全的形式互发信息，并对第三方组织窥探者隐藏发送者和接收者的信息。这是不依赖于一个中心服务器的通讯管理。...你可能没怎么听到过 Whisper，不过它也是在以太坊生态系统中一项有趣的技术。它是 Dapps 之间交互的通信协议。...你可以在这里看到关于它的更多内容: https://github.com/ethereum/wiki/wiki/Whisper

2.7K3 0

指标存储: 我们如何从Graphite + Whisper迁移到Graphite + ClickHouse

在这篇文章中，我将告诉您我们如何组织在高工作负载下的Graphite + Whisper到Graphite + ClickHouse的迁移，关于期望和迁移项目的结果。...在我详细介绍如何组织从Graphite + Whisper中存储指标到Graphite + ClickHouse的迁移之前，我想向您提供一些背景信息，说明这个决定的原因以及我们必须提出的Whisper的缺点很长一段时间...Graphite + Whisper的问题 1、磁盘子系统高负载在迁移时，我们每分钟收到大约150万个指标。在该指标流程中，我们的服务器的磁盘利用率约为30％。...2、缺乏复制和一致性最有可能的是，像使用或使用Graphite + Whisper的每个人一样，我们将相同的度量标准流程路由到多个Graphite服务器以实现弹性。...•要切换读数负载，请将平衡器设置中的端点从graphite-api（Graphite + Whisper API）重新配置为carbonapi。

1.7K2 1

【.NET】使用Whisper.net实现录音转文本

废话不多说，直接上手，以下正文： 1、新建一个控制台项目，引用CommandLineParser和Whisper.net 2、新建Options实体类，用于提供使用模型的一些参数 public class...在线模型文件参考：模型地址： https://huggingface.co/sandrohanea/whisper.net/tree/main/classic 4、验证模型文件不存在，则下载 if (...language); } processor.DetectLanguage(samples, speedUp: true) 的speedUp说明：当speedUp为true时，使用whisper_pcm_to_mel_phase_vocoder_with_state...当speedUp为false时，使用whisper_pcm_to_mel_with_state方法进行处理。这个方法可能是一个更传统或基本的方法来从PCM数据转换到Mel频谱。

3231 0

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支持其它98种语言的自动语音辨识。...当然，各大云平台都提供语音识别服务，但是基本都是联网运行，个人隐私安全总是有隐患，而whisper完全不同，whisper完全在本地运行，无需联网，充分保障了个人隐私，且whisper识别准确率相当高。...语言模型文件：https://huggingface.co/ggerganov/whisper.cpp 或者 https://github.com/ggerganov/whisper.cpp ggml...这么好的一个模型在.NET 社区有很多封装的项目: 跨平台 Whisper.net: https://github.com/sandrohanea/whisper.net Windows 平台的Whisper...：https://github.com/Const-me/Whisper 下面我们体验一下这个开箱即用的工具Whisper，从https://github.com/Const-me/Whisper 下周最新的版本

1.2K1 0

微调Whisper语音识别模型和加速推理

openai/whisper-tinyopenai/whisper-baseopenai/whisper-smallopenai/whisper-mediumopenai/whisper-largeopenai.../whisper-large-v2源码地址：Whisper-Finetune使用环境：Anaconda 3Python 3.8Pytorch 1.13.1Ubuntu 18.04GPU A100-PCIE...merge_lora.py：合并Whisper和Lora的模型。evaluation.py：评估使用微调后的模型或者Whisper原模型。...第二个--model_path指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。其他更多的参数请查看这个程序。...如下命令，--model参数指定的是合并后的模型路径，同时也支持直接使用Whisper原模型，例如直接指定openai/whisper-large-v2。

4.2K2 0

Windows系统搭建Whisper Web语言转文本服务并发布公网远程使用

前言 OpenAI开源的 Whisper 语音转文本模型效果都说还不错，今天就给大家推荐 GitHub 上一个开源项目 Whisper Web，允许你可直接在浏览器中运行使用 Whisper。...1.本地部署Whisper Web 接下来教大家如何在Windows系统本地安装Whisper Web 项目地址：https://github.com/xenova/whisper-web 1.1 安装...下载项目到本地，执行下面的命令： git clone https://github.com/xenova/whisper-web.git 创建新目录 cd whisper-web 1.2 安装Node.js...Whisper Web使用介绍在Whisper Web界面，我们可以使用粘贴音频地址，上传音频文件，和使用手机录入语音等方式进行语音转文本的操作。...配置公网地址接下来配置一下本地 Whisper Web 的公网地址，登录后，点击左侧仪表盘的隧道管理——创建隧道，创建一个 Whisper Web 的公网http地址隧道：隧道名称：可自定义命名

2491 0

带小朋友体验语音识别大模型：Whisper

三、安装 Whisper !pip install requests beautifulsoup4 !...pip install git+https://github.com/openai/whisper.git import torch import sys device = torch.device...from IPython.display import Markdown whisper_model = whisper.load_model(Model) if Model in whisper.available_models...Whisper 语音模型非常准确的识别出了我们的语音内容。...Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。它是通过收集来自多个数据源的多语言、多任务的数据进行训练的。

1.3K3 1

Whisper技术：探索偏底层逻辑的语音交互新篇章

而Whisper技术，作为语音交互领域的一颗璀璨明星，其偏底层逻辑的技术架构为我们揭示了语音交互的新篇章。本文将深入探讨Whisper技术的偏底层逻辑及其技术特点和应用前景。...一、Whisper技术概述Whisper技术是一种基于深度学习的语音识别与合成系统，其独特之处在于其偏底层逻辑的技术架构。...二、Whisper技术的偏底层逻辑信号处理：Whisper技术的偏底层逻辑首先体现在对语音信号的精细处理上。...三、Whisper技术的特点高精度语音识别：基于深度学习模型和精细的信号处理技术，Whisper技术能够实现高精度的语音识别，即使在复杂环境下也能保持较高的识别准确率。...四、Whisper技术的应用前景随着语音交互技术的不断发展，Whisper技术的应用前景非常广阔。在智能家居、车载语音助手、客户服务、教育领域等方面，Whisper技术都将发挥重要作用。

3781 0

OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

图注：Whisper 架构值得一提的是，由于「Whisper 」是在一个庞大且多样的数据集上进行，没有针对任何特定的数据集进行微调，因此它不会击败专门研究 LibriSpeech 性能的模型。...此外研究团队还发现，当在许多不同的数据集上测量「Whisper 」的零样本性能时，「Whisper 」相比其他模型表现更加稳健，错误率降低了 50%。...除了足够大的数据集规模外，「Whisper 」还支持多种语言的转录，以及将这些语言翻译成英语。...但对使用 Whisper 上，有不少用户也还存在疑虑。...网友 Vincent Lordier 提出，“此前在 GTP-3 和 Dalle-2 中出现对相关言论禁止行为，是否在使用 Whisper 时也会有，是否会出现 Whisper 编辑/删除用户语音的情况

2.2K1 0

openai whisper 语音识别，语音翻译

安装 apt install ffmpeg pip install -U openai-whisper 使用指令 whisper video.mp4 whisper audio.flac audio.mp3...audio.wav --model medium whisper japanese.wav --language Japanese whisper chinese.mp4 --language Chinese...--task translate whisper --help 代码中使用，以下是Python示例 import whisper model = whisper.load_model("base")...，如果前端要使用得通过接口，Whisper ASR Webservice帮我们提供了这样的接口，目前提供两个接口，一个音频语言识别和音频转文字（支持翻译和转录） Whisper ASR Webservice...除了支持Whisper，还支持faster-whisper；faster-whisper据说能够实现比 Whisper更快的转录功能，同时显存占用也比较小。

1.9K1 1

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战

今天，分享其对称功能（语音转文本）模型：Whisper。Whisper由OpenAI研发并开源，参数量最小39M，最大1550M，支持包含中文在内的多种语言。...二、Whisper 模型原理 2.1 模型架构 Whisper是一个典型的transformer Encoder-Decoder结构，针对语音和文本分别进行多任务（Multitask）处理。 ...2.2 语音处理 Whisper语音处理：基于680000小时音频数据进行训练，包含英文、其他语言转英文、非英文等多种语言。...仅用通俗易懂的语言描述了下Whisper的原理，如果想更深入的了解，请参考OpenAI官方Whisper论文。...首先简要概述了Whisper的模型原理，然后基于transformers的pipeline库2行代码实现了Whisper模型推理，希望可以帮助到大家。码字不易，如果喜欢期待您的关注+3连+投票。

4.7K1 0

结合SK和ChatGLM3B+whisper+Avalonia实现语音切换城市

结合SK和ChatGLM3B+whisper+Avalonia实现语音切换城市先创建一个Avalonia的MVVM项目模板,项目名称GisApp 项目创建完成以后添加以下nuget依赖 Whisper.net.Runtime" Version="1.5.0" /> Mapsui.Avalonia...是一个.NET的Whisper封装Whisper用的是OpenAI开源的语音识别模型 Whisper.net.Runtime属于Whisper 修改App.cs 打开App.cs，修改成以下代码 public...素材分享总结讨论总结:在本次会议中，讨论了如何结合SK、ChatGLM3B、Whisper和Avalonia来实现语音切换城市的功能。...和Whisper.net.Runtime。

2711 0

#whisper-to-stable-diffusion

在处理口音、背景噪声以及技术术语方面，Whisper 几乎达到了人类的水准。那么将 Whisper 与 Stable Diffusion 结合，可以直接完成语音生成图像的任务。...用户可以语音输入一个短句，Whisper 会自动将语音转化为文本，接着，Stable Diffusion 会根据文本生成图像。...图片来源：huggingface 第二步：检查语言输出，必要时进行更正图片来源：huggingface 第三步：等待1~10秒，直到有稳定的扩散结果图片来源：huggingface 简单概况一下，Whisper...不如现在就试试看: https://huggingface.co/spaces/fffiloni/whisper-to-stable-diffusion

4941 0

深度解析：如何用好 Whisper 的 `prompt` 和 `initial_prompt` 参数？

最近，OpenAI 的 Whisper 模型在语音转文字领域引起了广泛关注。...在使用 Whisper API 时，prompt 和 initial_prompt 都是可选参数，用于帮助模型更准确地转录音频内容。它们的核心区别在于作用时机和适用场景。...为了让 Whisper 在分段时保持一致的语言风格和语义理解，可以使用 initial_prompt。...结语 Whisper 模型在多语言语音转录领域展现了强大的能力，而 prompt 和 initial_prompt 是让它如虎添翼的关键工具。...如果觉得有用，不妨转发给需要的朋友，一起探索 Whisper 的更多可能性！

9531 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

高效音频转文本工具Whisper

whisper(音转文)使用教程

最佳语音识别 Whisper-large-v3-turbo 上线，速度更快（本地安装 + Whisper-web）

Whisper 整体架构图

语音转字幕：Whisper模型的功能和使用

微调Whisper模型和加速推理

Swarm和Whisper是什么鬼？

指标存储: 我们如何从Graphite + Whisper迁移到Graphite + ClickHouse

【.NET】使用Whisper.net实现录音转文本

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

微调Whisper语音识别模型和加速推理

Windows系统搭建Whisper Web语言转文本服务并发布公网远程使用

带小朋友体验语音识别大模型：Whisper

Whisper技术：探索偏底层逻辑的语音交互新篇章

OpenAI 发布新语音系统「Whisper 」，英文识别能力可接近人类水平

openai whisper 语音识别，语音翻译

【机器学习】Whisper：开源语音转文本（speech-to-text）大模型实战

结合SK和ChatGLM3B+whisper+Avalonia实现语音切换城市

#whisper-to-stable-diffusion

深度解析：如何用好 Whisper 的 `prompt` 和 `initial_prompt` 参数？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐