腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
CSDN博客
本人的CSDN博客:https://yeyupiaoling.blog.csdn.net/
专栏成员
举报
158
文章
271915
阅读量
36
订阅数
订阅专栏
申请加入专栏
全部文章(158)
深度学习(75)
人工智能(46)
神经网络(40)
https(30)
python(25)
android(23)
网络安全(21)
语音识别(15)
编程算法(15)
tensorflow(13)
java(11)
图像识别(11)
人脸识别(9)
数据(9)
机器学习(7)
xml(7)
打包(7)
开发(7)
模型(7)
声纹识别(6)
pytorch(5)
权限(5)
c++(4)
云数据库 SQL Server(4)
ide(4)
github(4)
api(4)
linux(4)
腾讯云测试服务(4)
http(4)
音频(4)
语音(4)
bash(3)
node.js(3)
android studio(3)
数据库(3)
sql(3)
ubuntu(3)
文字识别(3)
语音合成(3)
网站(3)
开源(3)
卷积神经网络(3)
windows(3)
程序(3)
服务(3)
日志(3)
php(2)
c#(2)
json(2)
phpmyadmin(2)
flask(2)
git(2)
tomcat(2)
centos(2)
容器镜像服务(2)
访问管理(2)
TDSQL MySQL 版(2)
容器(2)
存储(2)
opencv(2)
lan(2)
函数(2)
系统(2)
源码(2)
状态机(2)
负载均衡(1)
servlet(1)
jsp(1)
jquery ui(1)
css(1)
html(1)
mvc(1)
matlab(1)
负载均衡缓存(1)
nginx(1)
bash 指令(1)
spring(1)
黑石物理服务器(1)
文件存储(1)
视频处理(1)
serverless(1)
游戏(1)
缓存(1)
爬虫(1)
html5(1)
强化学习(1)
正则表达式(1)
gui(1)
numpy(1)
监督学习(1)
线性回归(1)
keras(1)
tcp/ip(1)
迁移学习(1)
powershell(1)
微信(1)
数据分析(1)
腾讯云开发者社区(1)
sdk(1)
验证码(1)
avplayer(1)
detection(1)
function(1)
listener(1)
overflow(1)
post(1)
random(1)
system(1)
time(1)
transform(1)
voice(1)
void(1)
web(1)
websocket(1)
width(1)
并发(1)
服务器(1)
工具(1)
框架(1)
视频(1)
调试(1)
异步(1)
搜索文章
搜索
搜索
关闭
鸿蒙应用开发-录音并使用WebSocket实现实时语音识别
开发
权限
数据
语音识别
websocket
录音并实时获取RAW的音频格式数据,利用WebSocket上传数据到服务器,并实时获取语音识别结果,参考文档使用AudioCapturer开发音频录制功能(ArkTS),更详细接口信息请查看接口文档:AudioCapturer8+和@ohos.net.webSocket (WebSocket连接)。
夜雨飘零
2024-05-26
293
0
识别准确率竟如此高,实时语音识别服务
语音识别
并发
服务
框架
源码
本文将介绍一个准确率非常高的语音识别框架,那就是FunASR,这个框架的模型训练数据超过几万个小时,经过测试,准确率非常高。本文将介绍如何启动WebSocket服务和Android调用这个服务来实时识别,一边说话一边出结果。
夜雨飘零
2023-10-23
1.1K
0
FunASR语音识别GUI界面应用
gui
语音识别
模型
视频
音频
本文将介绍一个基于FunASR开发的语音识别界面应用,这个应用可以选择本地音频,也可以录音识别。支持多种音频格式和视频格式,可以对识别的结果加上时间戳做成字幕。
夜雨飘零
2023-10-09
1.3K
0
微调Whisper语音识别模型和加速推理
语音识别
pytorch
transform
OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对Whisper模型使用Lora进行微调,目前开源了好几个模型,具体可以在openai查看,下面列出了常用的几个模型。另外项目最后还对语音识别加速推理,使用了CTranslate2加速推理,提示一下,加速推理支持直接使用Whisper原模型转换,并不一定需要微调。
夜雨飘零
2023-06-04
3.7K
0
微调Whisper模型和加速推理
语音识别
程序
模型
数据
语音
OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目,且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文。本项目主要的目的是为了对Whisper模型使用Lora进行微调,目前开源了好几个模型,具体可以在openai查看,下面列出了常用的几个模型。另外项目最后还对语音识别加速推理,使用了CTranslate2加速推理,提示一下,加速推理支持直接使用Whisper原模型转换,并不一定需要微调。
夜雨飘零
2023-04-30
2.3K
0
基于PaddlePaddle训练中文标点符号模型
深度学习
神经网络
人工智能
语音识别
本想是基于PaddleSpeech开发的中文标点符号模型,默认使用的预训练模型为ernie-3.0-medium-zh。该模型可以用于语音识别结果添加标点符号,使用案例PPASR。
夜雨飘零
2022-09-30
1.4K
0
给语音识别文本加上标点符号
神经网络
深度学习
人工智能
语音识别
https
在语音识别中,模型输出的结果只是单纯的文本结果,并没有根据语法添加标点符号,本教程就是针对这种情况,在语音识别文本中根据语法情况加入标点符号,使得语音识别系统能够输出在标点符号的最终结果。
夜雨飘零
2022-05-10
2.9K
0
基于PaddlePaddle实现的DeepSpeech2端到端中文语音识模型
神经网络
深度学习
人工智能
语音识别
windows
本项目是基于PaddlePaddle的DeepSpeech 项目开发的,做了较大的修改,方便训练中文自定义数据集,同时也方便测试和使用。DeepSpeech2是基于PaddlePaddle实现的端到端自动语音识别(ASR)引擎,其论文为《Baidu’s Deep Speech 2 paper》 ,本项目同时还支持各种数据增强方法,以适应不同的使用场景。支持在Windows,Linux下训练和预测,支持Nvidia Jetson等开发板推理预测。
夜雨飘零
2022-01-13
2.5K
0
PPASR中文语音识别(入门级)
语音识别
python
编程算法
c++
本项目将分三个阶段分支,分别是入门级、进阶级和应用级分支,当前为入门级,随着级别的提升,识别准确率也随之提升,也更适合实际项目使用,敬请关注!
夜雨飘零
2021-12-07
2.4K
0
PPASR语音识别(进阶级)
编程算法
神经网络
深度学习
人工智能
语音识别
本项目将分三个阶段分支,分别是入门级 、进阶级 和最终级 分支,当前为进阶级,随着级别的提升,识别准确率也随之提升,也更适合实际项目使用,敬请关注!
夜雨飘零
2021-12-07
1.2K
0
基于Pytorch实现的MASR中文语音识别
python
语音识别
编程算法
https
深度学习
MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于masr 进行开发的。
夜雨飘零
2021-12-07
3.4K
0
WenetSpeech数据集的处理和使用
语音识别
监督学习
python
WenetSpeech数据集 包含了10000+小时的普通话语音数据集,所有数据均来自 YouTube 和 Podcast。采用光学字符识别(OCR)和自动语音识别(ASR)技术分别标记每个YouTube和Podcast录音。为了提高语料库的质量,WenetSpeech使用了一种新颖的端到端标签错误检测方法来进一步验证和过滤数据。
夜雨飘零
2021-12-07
2.1K
0
PPASR流式与非流式语音识别
深度学习
神经网络
人工智能
python
语音识别
本项目将分三个阶段分支,分别是入门级 、进阶级 和最终级 分支,当前为最终级,持续维护版本。PPASR中文名称PaddlePaddle中文语音识别(PaddlePaddle Automatic Speech Recognition),是一款基于PaddlePaddle实现的语音识别框架,PPASR致力于简单,实用的语音识别项目。可部署在服务器,Nvidia Jetson设备,未来还计划支持Android等移动设备。
夜雨飘零
2021-12-07
1.2K
0
基于Pytorch实现的MASR中文语音识别
语音识别
人工智能
卷积神经网络
MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目,本项目是基于masr 进行开发的。
夜雨飘零
2020-07-30
4K
0
使用PaddlePaddle实现声纹识别
声纹识别
语音识别
神经网络
深度学习
人工智能
本章介绍如何使用PaddlePaddle实现简单的声纹识别模型,首先你需要熟悉音频分类,没有了解的可以查看这篇文章《基于PaddlePaddle实现声音分类》
夜雨飘零
2020-06-02
4.3K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档