CSDN博客-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

CSDN博客

本人的CSDN博客：https://yeyupiaoling.blog.csdn.net/

专栏成员

158

文章

271915

阅读量

36

订阅数

鸿蒙应用开发-录音并使用WebSocket实现实时语音识别

开发权限数据语音识别 websocket

录音并实时获取RAW的音频格式数据，利用WebSocket上传数据到服务器，并实时获取语音识别结果，参考文档使用AudioCapturer开发音频录制功能(ArkTS)，更详细接口信息请查看接口文档：AudioCapturer8+和@ohos.net.webSocket (WebSocket连接)。

2024-05-26

2930

识别准确率竟如此高，实时语音识别服务

语音识别并发服务框架源码

本文将介绍一个准确率非常高的语音识别框架，那就是FunASR，这个框架的模型训练数据超过几万个小时，经过测试，准确率非常高。本文将介绍如何启动WebSocket服务和Android调用这个服务来实时识别，一边说话一边出结果。

2023-10-23

1.1K0

FunASR语音识别GUI界面应用

gui 语音识别模型视频音频

本文将介绍一个基于FunASR开发的语音识别界面应用，这个应用可以选择本地音频，也可以录音识别。支持多种音频格式和视频格式，可以对识别的结果加上时间戳做成字幕。

2023-10-09

1.3K0

微调Whisper语音识别模型和加速推理

语音识别 pytorch transform

OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对Whisper模型使用Lora进行微调，目前开源了好几个模型，具体可以在openai查看，下面列出了常用的几个模型。另外项目最后还对语音识别加速推理，使用了CTranslate2加速推理，提示一下，加速推理支持直接使用Whisper原模型转换，并不一定需要微调。

2023-06-04

3.7K0

微调Whisper模型和加速推理

语音识别程序模型数据语音

OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对Whisper模型使用Lora进行微调，目前开源了好几个模型，具体可以在openai查看，下面列出了常用的几个模型。另外项目最后还对语音识别加速推理，使用了CTranslate2加速推理，提示一下，加速推理支持直接使用Whisper原模型转换，并不一定需要微调。

2023-04-30

2.3K0

基于PaddlePaddle训练中文标点符号模型

深度学习神经网络人工智能语音识别

本想是基于PaddleSpeech开发的中文标点符号模型，默认使用的预训练模型为ernie-3.0-medium-zh。该模型可以用于语音识别结果添加标点符号，使用案例PPASR。

2022-09-30

1.4K0

给语音识别文本加上标点符号

神经网络深度学习人工智能语音识别 https

在语音识别中，模型输出的结果只是单纯的文本结果，并没有根据语法添加标点符号，本教程就是针对这种情况，在语音识别文本中根据语法情况加入标点符号，使得语音识别系统能够输出在标点符号的最终结果。

2022-05-10

2.9K0

基于PaddlePaddle实现的DeepSpeech2端到端中文语音识模型

神经网络深度学习人工智能语音识别 windows

本项目是基于PaddlePaddle的DeepSpeech 项目开发的，做了较大的修改，方便训练中文自定义数据集，同时也方便测试和使用。DeepSpeech2是基于PaddlePaddle实现的端到端自动语音识别（ASR）引擎，其论文为《Baidu’s Deep Speech 2 paper》，本项目同时还支持各种数据增强方法，以适应不同的使用场景。支持在Windows，Linux下训练和预测，支持Nvidia Jetson等开发板推理预测。

2022-01-13

2.5K0

PPASR中文语音识别（入门级）

语音识别 python 编程算法 c++

本项目将分三个阶段分支，分别是入门级、进阶级和应用级分支，当前为入门级，随着级别的提升，识别准确率也随之提升，也更适合实际项目使用，敬请关注！

2021-12-07

2.4K0

PPASR语音识别（进阶级）

编程算法神经网络深度学习人工智能语音识别

本项目将分三个阶段分支，分别是入门级、进阶级和最终级分支，当前为进阶级，随着级别的提升，识别准确率也随之提升，也更适合实际项目使用，敬请关注！

2021-12-07

1.2K0

基于Pytorch实现的MASR中文语音识别

python 语音识别编程算法 https 深度学习

MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目，本项目是基于masr 进行开发的。

2021-12-07

3.4K0

WenetSpeech数据集的处理和使用

语音识别监督学习 python

WenetSpeech数据集包含了10000+小时的普通话语音数据集，所有数据均来自 YouTube 和 Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量，WenetSpeech使用了一种新颖的端到端标签错误检测方法来进一步验证和过滤数据。

2021-12-07

2.1K0

PPASR流式与非流式语音识别

深度学习神经网络人工智能 python 语音识别

本项目将分三个阶段分支，分别是入门级、进阶级和最终级分支，当前为最终级，持续维护版本。PPASR中文名称PaddlePaddle中文语音识别（PaddlePaddle Automatic Speech Recognition），是一款基于PaddlePaddle实现的语音识别框架，PPASR致力于简单，实用的语音识别项目。可部署在服务器，Nvidia Jetson设备，未来还计划支持Android等移动设备。

2021-12-07

1.2K0

基于Pytorch实现的MASR中文语音识别

语音识别人工智能卷积神经网络

MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目，本项目是基于masr 进行开发的。

2020-07-30

4K0

使用PaddlePaddle实现声纹识别

声纹识别语音识别神经网络深度学习人工智能

本章介绍如何使用PaddlePaddle实现简单的声纹识别模型，首先你需要熟悉音频分类，没有了解的可以查看这篇文章《基于PaddlePaddle实现声音分类》

2020-06-02

4.3K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态