控制台指南

最佳实践

开发者指南

API 文档

SDK 文档

设置语音识别

最近更新时间:2022-05-12 16:00:57

简介

语音识别功能可以对已经录制完成的录音文件,进行识别,并异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。

注意事项

  • 支持中文普通话、英语和粤语的语音识别。
  • 语音文件的时长不能大于5小时,文件大小不超过512MB。
  • 语音识别是付费服务,由数据万象计费,按照识别时长进行计费,详细的计费说明请参见数据万象 内容识别费用
  • 数据万象在每个账户在首次产生该服务用量后,将发放一个用量为20小时,有效期为2个月的免费额度资源包,超出用量或资源包到期后将正常计费。
  • 语音识别只支持中国大陆公有云地域。

操作步骤

您可通过控制台开启服务,开启服务后,对于当前存储桶中的音频资源,使用相应的 语音识别 API 接口即可创建语音识别任务。

  1. 登录 对象存储控制台
  2. 在左侧导航栏中,单击存储桶列表,进入存储桶列表管理页面。
  3. 找到需要操作的存储桶,单击该存储桶名称,进入该存储桶管理页面。
  4. 在左侧导航栏中,单击数据处理 > 内容识别,进入内容识别管理页面。
  5. 语音识别配置项中,单击编辑,将状态修改为开启
  6. 开启服务后,系统会自动创建一个数据万象媒体任务队列。当用户 提交语音识别任务 后,任务会先进入队列中进行排列,系统将根据优先级和提交顺序依次执行。
  7. 队列创建完毕后,可以设置回调规则,及时了解任务或工作流进度,同时系统会将处理结果状态提交到您的指定地址。
  8. 单击队列操作栏中的回调规则
  9. 在弹出的窗口中,单击编辑,单击当前状态,即可开启或关闭回调。开启回调需设置指定 URL,用于系统发送 HTTP 请求。回调详情请查看回调内容。

回调内容

任务完成后,系统会向您设置的回调地址发送回调内容,内容展示如下:

<Response>
        <JobsDetail></JobsDetail>
        <NonExistJobIds></NonExistJobIds>
</Response>

参数说明如下:

参数 描述 类型
JobsDetail 任务的详细信息,同 CreateMediaJobs 接口的 Response.JobsDetail 节点 Container
NonExistJobIds 查询的 ID 中不存在的任务,所有任务都存在时不返回 String
目录