首页标签语音识别

#语音识别

应用业界最先进的深度学习算法,具备出色的语音转文字、关键词检索、静音检测、语速检测、情绪识别能力

基于 Blazor 打造一款实时字幕

newbe36524

荷培信息科技(上海)有限公司 · 后端开发工程师 (已认证)

早先在录制视频的时候一直使用的是 obs-auto-subtitle 作为实时字幕展示功能。不过这个是以 OBS 插件的形式存在,不管是语言和功能上都有一定的限...

8700

腾讯云ASR产品-PHP实现实时语音鉴权请求

袁伦桥

(2)腾讯云控制台开通实时语音权限 https://console.cloud.tencent.com/asr

60850

【玩转腾讯云】语音转文字,轻松写笔记

tonglei0429

腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务...

40600

音频知识(一)

languageX

腾讯 · 高级研究员 (已认证)

音调主要和声波的频率有关。但是音调和频率并不是成正比的关系,它还与声音的强度 及波形有关。

39240

在线公众号文章内容转音频文件实用小工具

IT技术分享社区

神彩科技股份有限公司 · Java工程师 (已认证)

软件地址:https://gitee.com/hgm1989/online_speech_recognition

16180

基于变压器的两次通过语音识别

甜甜圈

交互式语音识别系统必须快速生成单词,同时还要产生准确的结果。通过使用快速发出字的第一遍解码器和需要更多上下文但更准确的第二遍解码器,两次遍历模型在这些要求上表现...

8900

TRTC 接入实时语音识别

许岳操

1,打开您的 Xcode 工程项目,选择要运行的 target , 选中Build Phases项。

26460

腾讯云一句话识别-iOS直接请求服务器Demo

许岳操

2,引入自己的项目,只需要将viewDidLoad方法的内容copy到对应的控制器

14940

V3手动鉴权失败之C#篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

89850

V3手动鉴权失败之PHP篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

92160

精选CVPR开源项目学习资源汇总

三次方AIRX

关于更多机器学习、人工智能、增强现实、Unity、Unreal资源和技术干货,可以关注公众号:AIRX社区

20530

V3手动鉴权失败之Java篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

89250

V3手动鉴权失败之Python篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

14160

V3手动鉴权失败之Go篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

15130

V3手动鉴权失败之Nodejs篇

周朋伟

腾讯云 API 全新升级 3.0 ,该版本进行了性能优化且全地域部署、支持就近和按地域接入、访问时延下降显著,接口描述更加详细、错误码描述更加全面、SDK增加接...

330140

AI赋能产品:如何寻找语音交互的业务场景

云加直播

腾讯 · 产品运营 (已认证)

作者:廖欣欣 《游戏运营:高手进阶之路》作者 / IEG 用户平台部 智能AI高级产品经理

18070

语音交互有哪些优势与劣势?

深蓝学院

语音交互是指人与人、人与设备之间,通过自然语音进行信息传递的过程。人与人之间通过语音来传递信息、交流感情等等,其实就是一种最基本的人与人之间的语音交互。

27330

端到端声源分离研究:现状、进展和未来

深蓝学院

什么是端到端音源分离呢?罗艺老师首先介绍了端到端音源分离的定义。从名称来看,端到端的含义是模型输入源波形后直接输出目标波形,不需要进行傅里叶变换将时域信号转换至...

556750

腾讯云语音识别v1签名算法详解

算法发

v1的签名文档:https://cloud.tencent.com/document/product/1093/35642

35120

腾讯云语音识别之录音文件识别.net-sdk使用

算法发

接口:https://console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14...

22220

相关产品

  • 语音识别 ASR

    应用业界最先进的深度学习算法,具备出色的语音转文字、关键词检索、静音检测、语速检测、情绪识别能力

活跃用户

  • 找虫虫

    0 文章358 回答9 关注

扫码关注云+社区

领取腾讯云代金券