前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ASR语音识别应用实践指导

ASR语音识别应用实践指导

原创
作者头像
keke.wang
发布2022-12-09 11:14:05
8460
发布2022-12-09 11:14:05
举报
文章被收录于专栏:腾讯云原生实践教程

ASR 语音识别引用深度融合了腾讯云 ASR 和 TRTC,用于将 TRTC 房间的语音数据实时放回,

应用运行在云函数 SCF 上,通过 API 网关暴露请求入口,客户可以直接请求 API 快速发起 TRTC 房间的语音识别。

补充:ASR 语音识别应用的官方指导文档(https://cloud.tencent.com/document/product/1154/65812

整体架构预览

整体流程如下:

arch
arch

环境变量

在应用部署之后,可以通过修改环境变量调整(或者开启)应用的某些特性,目前支持的环境变量有:

  • ENV_REALTIME_ENABLE=true 返回识别中间结果,不设置该环境变量只返回一句话识别完成后的结果
  • ENV_ENGINETYTE=16k_en 语音识别引擎,配置16k_en,不设置该环境变量默认使用16k_zh
  • DEBUG=on 开启debug模式

API 网关

应用部署之后,API 网关默认是开启了应用认证,如果请求端不支持应用认证方式,则会返回如下报错:

代码语言:shell
复制
HMAC signature cannot be verified

建议:

1、测试时,可以先调整 API 网关的认证模式 为 免认证。

2、使用应用认证方式,以 golang 语言为例,参考:https://cloud.tencent.com/document/product/628/56544

TRTC 房间的高级权限控制

线上的 TRTC 房间往往都会开启高级权限控制,而当前最新版的 ASR 语音识别应用也支持了开启了高级权限控制的房间加入。

请求示例参考如下:

代码语言:shell
复制
{
    "SdkAppId": 1400000000,
    "RoomId": 43474,
    "UserId": "user_55952145",
    "UserSig": "eJwtzNEKgkAUBNBxxxxxxx",
    "Callback": "https:xxxxxxxx.com/post/xxx"
    "PrivateKey": "xxxxxxxxx"
}

补充:TRTC 的高级权限控制(https://cloud.tencent.com/document/product/647/32240

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 整体架构预览
  • 环境变量
  • API 网关
  • TRTC 房间的高级权限控制
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档