操作场景
智能字幕功能利用语音识别技术,能够准确识别常用词汇。然而,对于特定的人名、产品名、公司名和行业专有词汇(如品牌名“智聆”、建筑名“滨海大厦”、保险领域的“核保”、云存储的“存储桶”等),识别准确率可能降低。为了解决这个问题,我们提供了自定义热词库功能,用户可以添加热词,以显著提升对专有词汇的识别准确率。当识别语音时,若遇到同音同调情况,系统将优先考虑权重较高的热词。
前提条件
1. 已 注册腾讯云 账户并完成实名认证。
新建词库
新建指引
1. 进入模板管理 > 媒体 AI 模板 > 智能字幕,在智能字幕模板列表页面,单击管理热词库,可以打开自定义热词库列表。

2. 单击新建词库,您可以通过手动输入或文件导入的方式输入热词。
若手动输入,多个热词用英文逗号分割,热词和权重间用英文符号|隔开。例如:“腾讯云|10,语音识别|5,ASR|11”。

若通过文件导入,文件必须为 UTF-8 或 GBK 编码格式,每行仅添加一个热词和对应权重(热词和权重间用英文符号|隔开),不能包含标点和特殊字符。热词文件示例如下:

热词配置说明
常见的通用词汇不建议加入热词,例如“客户”、“朋友”等词汇,加入过多的通用词汇会降低专有词汇的识别率。
数字推荐按照发音替换为对应汉字,例如“689元”替换为“六百八十九元”。
热词权重越大,被识别出来的概率越大,热词权重的范围为[1,11]之间的整数,以及数值100,具体对应关系如下:
当热词权重设置为1-10之间,热词为通用热词,生效强度随数值变大而增大。
当热词权重设置为11时,热词将升级为超级热词。建议仅将重要且必须生效的热词设置到11,设置过多权重为11的热词将影响整体字准率。
当热词权重设置为100时,热词将升级为热词增强版。热词增强版为同音替换功能,请谨慎开启。
注意:
热词增强版(权重100)仅支持中文普通话语种。
每个热词表最多可添加 128 个热词(如有超过限制的需求,请 联系我们)。
每个热词最长10个汉字或30个英文字符,不能包含标点和特殊字,不能超出限制。
热词的添加可以显著提高识别准确率,是快速提升专有领域词汇的重要途径之一。然而,仍有可能存在无法正确识别的情况。请首先确保音频的清晰度和质量达到标准,即普通人听一遍录音就能正确识别出文字。
关联热词库与模板

注意:
目前热词库只支持中文普通话、英文语种,因此,只有当视频语音源语言为简体中文、英文时,才支持关联热词库。
查看热词库
进入智能字幕模板 > 管理热词库,单击词库操作的查看,即可预览词库详情。

修改热词库
进入智能字幕模板 > 管理热词库,单击词库操作的编辑,即可修改词库配置。
若热词通过文件导入,您可以通过重新上传文件修改热词。

删除热词库
在自定义热词库页面,找到并选中您想要操作的词库,然后单击右侧的删除,即可删除该词库。
注意:
删除后无法恢复,建议您先确保该热词库未关联至模板、未用于线上业务,再进行删除操作。
