原创

语音识别内容

PAAS层

语音识别的技术原理

产品功能

采样率

语种

行业

自服务

效果自调优

VAD静音检测

录音文件识别,一句话识别,在ASR服务端处理。

VAD是减小系统功耗的,实时音频流。建议开启VAD,一分钟之后的结果就没有了。

开了VAD之后,就可以超过60秒,但是还是建议用户开启。

如果是断断续续的。

一般人也不能一口气说60秒。

所有的友商都是这么写的,

这么听是没有问题的,但是不建议这么做,实时的音频采样率。

Q1:会是怎样的一种对应关系呢?

Q2:静音状态会不会收费呢?

接口要求

集成实时语音识别 API 时,需按照以下要求。

内容

说明

支持语言

中文普通话、英文、粤语、韩语

支持行业

通用、金融

音频属性

采样率:16000Hz或8000Hz、采样精度:16bits、声道:单声道

音频格式

wav、pcm、opus、speex、silk、mp3

数据长度

音频流中每个数据包的音频分片建议为200ms,8k采样率对应的音频分片大小为3200字节,16k采样率对应的音频分片大小为6400字节

请求协议

HTTP

请求地址

http://asr.cloud.tencent.com/asr/v1/<appid>?{请求参数}

接口鉴权

签名鉴权机制,详见 签名生成

响应格式

统一采用 JSON 格式

开发语言

任意,只要可以向腾讯云服务发起 HTTP 请求的均可

请求频率限制

50次/秒

音频属性

这里添加声道这个参数:

ChannelNum

Integer

语音声道数。1:单声道;2:双声道(仅支持 8k_zh 引擎模型)。

Q1:录音文件保存成双通道,

A1:但是你传过来的音频,必须是双通道的。是你音频文件生成好的。是一个实时音频流的概念。

Q2:实时语音识别的分片是200毫秒吗?

A2:IOS的SDK. 200ms对应的

3. 输出参数

参数名称

类型

描述

Data

Task

录音文件识别的请求返回结果,包含结果查询需要的TaskId

RequestId

String

唯一请求 ID,每次请求都会返回。定位问题时需要提供该次请求的 RequestId。

这么一个特点是

能量频谱图,选择频谱显示。

采样是正常的采样。

季友生,云剑飞。

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

相关文章

  • 教你怎么使用机票行程识别接口

    https://console.cloud.tencent.com/api/explorer?Product=ocr&Version=2018-11-19&Ac...

    算法发
  • 腾讯云文字识识别使用笔记0825

    本接口支持机票行程单关键字段的识别,包括姓名、身份证件号码、航班号、票价 、合计、电子客票号码、填开日期等。

    算法发
  • 腾讯云录音文件识别

    帮助文档:https://cloud.tencent.com/document/product/1093/38351

    算法发
  • Facebook运用全息折叠光学技术,演示 “迄今为止最薄VR显示器”

    (VRPinea 7月14日讯)Facebook的AR / VR研发部门Facebook Reality Labs 于近日发布一项新研究,研究提出了一种结合全息...

    VRPinea
  • 让WordPress 在RSS 中Feed 输出支持“More”标签

    如果你的主题支持“more”标签,在写文章的时候加上“more”标签,首页就可以截断显示。“more”标签截断文章的意义在于能够随心所欲,想断就断(汗,越写越废...

    Jeff
  • 设计模式(2): 观察者模式-1

    The observer pattern is a softeware desugn pattern in which an object, called th...

    用户2434869
  • [设计模式] 观察者模式

    对于观察模式的实现方式有很多种,一般是以包含Subject和Observer接口的类设计做法最为常见。

    架构探险之道
  • Kafka重平衡机制

    重平衡跟消费组紧密相关,它保证了消费组成员分配分区可以做到公平分配,也是消费组模型的实现,消费组模型如下:

    张乘辉
  • 吹弹牛皮之Unity 事件订阅系统

    Unity世界有着太多的事情需要借助事件系统去完成。小菜记得《大话设计模式》中是以老猫Tom和两只老鼠Jerry和Jack来生动形象的描述这个过程的(这...

    用户7698595
  • 注解:为计算机而做的注释

    编写文档:通过代码里标识的注解生成文档【生成文档doc文档】 代码分析:通过代码里标识的注解对代码进行分析【使用反射】 编译检查:通过代码里标识的注解让编译器能...

    BWH_Steven

扫码关注云+社区

领取腾讯云代金券