自学习模型

最近更新时间:2019-12-10 14:42:01

注意:

自学习模型已经在录音文件识别、实时语音识别和一句话识别中上线。目前版本为 Beta 版本,免费试用,如有定价方面的变动也将提前通知存量客户。

自学习模型介绍

腾讯云目前仅提供通用领域的语音识别服务,对应的语言模型为基础语言模型。如果用户在专有领域或行业积累了丰富的文本数据,那么可以用语言模型自学习工具进行定制优化,通过优化可以有效提高文本场景下的语音识别准确率。

优化建议

  1. 训练数据为用户在专有领域和行业积累的文本数据,数据越接近真实使用场景,识别准确率越高;
  2. 训练文本中的数字部分最好按照发音替换为对应的汉字,例如“689元”替换为“六百八十九元”。

格式要求

  • 训练文本格式要求 GBK 编码的 txt 文件,文件最大不超过1MB;
  • 每行添加一个词或一句话,详见 训练文本数据示例
  • 每行的字节数最多为1000,总行数最多为50万;

添加方法

  1. 整理在专有领域和行业积累的文本数据,保存成 GBK 编码的 TXT 文件,具体格式要求参考 格式要求

  2. 进入腾讯云 语音识别控制台-自学习模型页,单击“新建”,新建模型;

  3. 填写模型名称,正确选择您需要应用该自学习模型的功能引擎类型,上传训练数据文件并提交;

  4. 等待模型训练完成后,单击上线;

  5. 确认模型已上线后,通过 语音识别 API 或 SDK 调用该模型对应的功能接口和引擎类型,测试识别效果;

使用限制

同一个账号最多允许同时上线1个自学习模型;

训练文本数据示例