腾讯云语音识别服务对于常用词汇的识别效果极佳,但对一些特有的人名、产品名、公司名等专有词汇或者敏感词,可能存在识别准确率降低的情况。如果配置了热词后,仍然效果不好,腾讯云语音识别提供了替换词能。添加替换词可以显著提升通用引擎在这类专有词汇上的识别准确率。
功能介绍:替换词表
替换词表的逻辑是绝对匹配,强制替换,在每次请求时直接传入替换词表 ID 即可使用替换词功能。
支持范围:
使用限制
默认每个账号(AppID 维度)最多可创建10个替换词表,每个替换词表最多可添加200个替换词,每个替换词最长10个汉字,30个字符。
替换词表文件必须为 UTF-8 或 GBK 编码格式,每行仅添加一个替换词和被替换词(中间用英文符号
|
隔开),不能包含标点和特殊字符。替换词生效流程
客户通过控制台配置创建替换词表并获取替换词表 ID,无默认生效的替换词。
产品后端服务将替换词表配送至识别层(由后端服务完成,客户无感知)。
客户发起语音识别请求,并传入替换词表 ID。
识别层根据请求传入的替换表 ID 生效对应的替换词(由后端服务完成,用户无感知)。
通过控制台配置
1. 新建替换词表和上传替换词
1.1 登录语音识别控制台,单击左侧菜单栏词汇替换,进入替换词管理页面。

单击新建替换词表。

1.2 在弹出页面中填写替换词表名,上传替换词表文件,填写完成后,单击确定。

1.3 上传完成后,可以查看到生成的替换词表 ID,可以在调用语音识别或者录音文件识别接口是,传入替换词表 ID,即可使用该功能。

2. 更新替换词
在替换词表列表中,选择操作 > 更新,在弹出页面单击重新上传,上传成功后单击确定。

3. 下载替换词
在替换词表的列表中,选择操作 > 下载,可直接下载替换词内容到本地。
4. 删除替换词
在替换词表的列表中,选择操作 > 删除,在弹出页面中单击确定,即可删除当前替换词表。删除后,替换词数据和效果均无法恢复。

5. 替换词示例
需要同时提供被替换词和替换词。也可以在新建替换词表时,下载样例文件查看示例。
