简介

最近更新时间:2025-08-08 01:05:08

我的收藏

语音识别(Automatic Speech Recognition,ASR)为开发者提供语音转文字服务的最佳体验,开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求,具备识别准确率高、接入便捷、性能稳定等特点。
本章节介绍的语音识别 API 接口为 API 2.0/3.0 接口。
您可以调用 API 对语音识别进行操作,例如创建录音文件识别请求、创建热词表等。
语音识别支持的所有接口信息,请参见 API 概览

术语表

语音识别 API 接口的常见术语请参见下表:

术语
描述
热词 腾讯云语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名或者某个领域的专有词汇,例如:品牌名智聆、建筑名滨海大厦、保险领域专业词汇核保、云存储专业词汇存储桶等,可能存在识别准确率降低的情况。对于这些专有词汇,腾讯云语音识别提供了热词功能供用户使用,添加热词可以显著提升通用引擎在这类专有词汇上的识别准确率。
自学习模型 腾讯云目前提供的通用领域语音识别服务,能够在大部分场景下实现较好的识别效果。对于专业名词、特殊表达较多的应用场景,我们提供了自学习定制模型帮助用户自助提升专有领域的识别效果。
如果用户在专有领域或行业积累了丰富的文本数据,可以用自学习定制模型进行定向优化,从而有效提高语音识别准确率。
替换词 腾讯云语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名等专有词汇或者敏感词,可能存在识别准确率降低的情况。如果配置了热词后,仍然效果不好,腾讯云语音识别提供了替换词功能。添加替换词可以显著提升通用引擎在这类专有词汇上的识别准确率。

使用限制

对于 API 接口的参数限制,请参考各接口文档中的参数说明。

API 快速入门

您可以使用 API Explorer 工具在线调用 API。
本文以录音文件识别请求为例,通过 API Explorer 工具调用 API 接口的步骤如下:
1.进入 API Explorer 页面。更多 API Explorer 工具使用信息,请参见 使用 API Explorer
2.调用 CreateAsyncRecognitionTask 接口,创建录音文件识别请求。
3.创建录音文件识别请求后,通过接口返回拿到结果查询需要的 TaskId 。至此,录音文件识别请求创建完成。