夜雨飘零

文章/答案/技术大牛

发布

LV1

发表了文章 2024-05-262024-05-26 16:12:27

鸿蒙应用开发-录音并使用WebSocket实现实时语音识别

录音并实时获取RAW的音频格式数据，利用WebSocket上传数据到服务器，并实时获取语音识别结果，参考文档使用AudioCapturer开发音频录制功能(Ar...

夜雨飘零 2024-05-262024-05-26 16:12:27

开发、权限、数据、语音识别、websocket

发表了文章 2024-05-262024-05-26 16:11:54

鸿蒙应用开发-录音保存并播放音频

录音并保存为m4a格式的音频，然后播放该音频，参考文档使用AVRecorder开发音频录制功能(ArkTS)，更详细接口信息请查看接口文档：@ohos.mult...

夜雨飘零 2024-05-262024-05-26 16:11:55

函数、开发、权限、音频、状态机

发表了文章 2024-05-262024-05-26 16:11:14

鸿蒙应用开发-自定义可删除列表弹窗

自定义列表弹窗，可以对弹窗的列表点击删除，参考文档创建列表，自定义弹窗文档自定义弹窗（CustomDialog）。

夜雨飘零 2024-05-262024-05-26 16:11:14

数据、listener、void、开发、权限

发表了文章 2024-05-262024-05-26 16:10:37

鸿蒙应用开发-仿微信聊天对话对话信息列表

src/main/ets/model/MsgDataSource.ets编写的是对列表的操作，如添加数据、获取列表大小，通过操作这个对象，控制列表显示。

夜雨飘零 2024-05-262024-05-26 16:10:38

微信、width、开发、权限、数据

发表了文章 2024-05-262024-05-26 16:10:07

鸿蒙应用开发-发送POST请求并获取结果

夜雨飘零 2024-05-262024-05-26 16:10:07

开发、模型、数据、异步、post

发表了文章 2024-05-262024-05-26 16:09:44

鸿蒙应用开发-播放本地音频文件

播音音频，提高音频文件路径，播放音频。参考文档使用AVPlayer开发音频播放功能。

夜雨飘零 2024-05-262024-05-26 16:09:44

开发、音频、状态机、avplayer、函数

发表了文章 2024-05-262024-05-26 16:09:21

鸿蒙应用开发-请求语音合成服务获取音频文件

请求语音合成服务，通过上传语音合成文本，返回音频数据，并保存到本地。这里要说明一下，由于HttpResponse接口给问题，服务的响应类型必须是applicat...

夜雨飘零 2024-05-262024-05-26 16:09:21

数据、语音合成、服务、开发、权限

发表了文章 2023-12-182023-12-18 13:34:05

实时指令唤醒

本文将介绍一个实时指令唤醒的程序，可以添加任意的指令，实时录音一旦检测到指令语音，激活程序。同时还支持指令微调、提高指令的准确率。

夜雨飘零 2023-12-182023-12-18 13:34:08

time、程序、模型、日志、数据

发表了文章 2023-12-182023-12-18 13:33:39

语音指令控制坦克大战

本文将介绍一个可以通过语音指令来控制坦克大战游戏的程序，用户只需要添加几个疾病区然后控制坦克进行向上、向下、向左、向右、开火、停止等操作。同时还支持指令微调、提...

夜雨飘零 2023-12-182023-12-18 13:33:44

游戏、程序、模型、日志、数据

发表了文章 2023-10-232023-10-23 09:27:43

识别准确率竟如此高，实时语音识别服务

本文将介绍一个准确率非常高的语音识别框架，那就是FunASR，这个框架的模型训练数据超过几万个小时，经过测试，准确率非常高。本文将介绍如何启动WebSocket...

夜雨飘零 2023-10-232023-10-23 09:27:44

语音识别、并发、服务、框架、源码

发表了文章 2023-10-232023-10-23 09:05:03

轻松快速搭建一个本地的语音合成服务

本文将介绍一个可以快速搭建本地语音合成的服务，模型和代码已全部提供，不需要联网运行。项目使用的是VITS模型结构，能够很轻松地启动服务。

夜雨飘零 2023-10-232023-10-23 09:05:04

语音合成、服务、服务器、模型、源码

发表了文章 2023-10-092023-10-09 08:24:14

FunASR语音识别GUI界面应用

本文将介绍一个基于FunASR开发的语音识别界面应用，这个应用可以选择本地音频，也可以录音识别。支持多种音频格式和视频格式，可以对识别的结果加上时间戳做成字幕。

夜雨飘零 2023-10-092023-10-09 08:24:18

gui、语音识别、模型、视频、音频

发表了文章 2023-08-212023-08-21 08:24:53

基于PaddlePaddle实现的声纹识别系统

本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型，不排除以后会支持更多模型，同时本项目也支持了MelSpe...

夜雨飘零 2023-08-212023-08-21 08:24:53

声纹识别、模型、系统、音频、语音

发表了文章 2023-08-212023-08-21 08:24:26

基于Pytorch实现的声纹识别系统

本项目使用了EcapaTdnn、ResNetSE、ERes2Net、CAM++等多种先进的声纹识别模型，不排除以后会支持更多模型，同时本项目也支持了MelSpe...

夜雨飘零 2024-07-212024-07-21 07:40:24

声纹识别、pytorch、数据、系统、语音

发表了文章 2023-06-042023-06-04 15:57:08

微调Whisper语音识别模型和加速推理

OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务...

夜雨飘零 2023-06-042023-06-04 15:57:08

语音识别、pytorch、transform

发表了文章 2023-04-302023-04-30 14:49:34

微调Whisper模型和加速推理

OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务...

夜雨飘零 2023-04-302023-04-30 14:49:34

语音识别、程序、模型、数据、语音

发表了文章 2022-11-302022-11-30 16:24:21

基于PaddlePaddle实现的目标检测模型PP-YOLOE

本项目是基于PaddleDetection实现的PP-YOLOE，PP-YOLOE是单阶段Anchor-free模型，其精度(COCO数据集mAP)和推理速度均...

夜雨飘零 2022-11-302022-11-30 16:24:21

android、python、json

发表了文章 2022-11-282022-11-28 15:54:54

使用VAD将长语音分割的多段短语音

今天来介绍一个VAD的工具，VAD（Voice Activity Detection）语音活动检测，是可以把一段长语音以静音位置把语音分割成多段短语音，常见的就...

夜雨飘零 2022-11-282022-11-28 15:54:54

detection、voice、web、工具、语音

发表了文章 2022-09-302022-09-30 14:46:27

基于PaddlePaddle训练中文标点符号模型

本想是基于PaddleSpeech开发的中文标点符号模型，默认使用的预训练模型为ernie-3.0-medium-zh。该模型可以用于语音识别结果添加标点符号，...

夜雨飘零 2022-09-302022-09-30 14:46:27

深度学习、神经网络、人工智能、语音识别

发表了文章 2022-09-072022-09-07 16:56:40

使用PaddlePaddle轻松实现语音合成

使用PaddlePaddle轻松实现语音合成，提供了简单的示例代码，GUI界面操作，还有Flask的Web接口，可以给Android调用。

夜雨飘零 2022-09-072022-09-07 16:56:40

语音合成、android、flask、神经网络、深度学习

12 3 4 5 6 7 8 9 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2017-12-11

个人成就

获得 584 次赞同
文章被阅读 301K 次

关注了：1关注者：62