API 文档

SDK 文档

诚邀爱技术、爱分享的你,成为文档内容共建者> HOT

简介

语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。

相关说明

  • 支持中文普通话、英语和粤语的语音识别。
  • 支持 wav、mp3、m4a 的音频格式。
  • 语音文件的时长不能大于5小时,文件大小不超过512MB。
说明:

  • 语音识别是付费服务,按照识别时长进行计费,具体费用请参见 计费与定价
  • 数据万象在每个账户在首次产生该服务用量后,将发放一个用量为20小时,有效期为2个月的免费额度资源包,超出用量或资源包到期后将正常计费。

操作步骤

您可通过控制台开启服务,开启服务后,对于当前存储桶中的音频资源,使用相应的语音识别接口即可创建语音识别任务。

  1. 登录 数据万象控制台 ,单击左侧导航栏【存储桶管理】。
  2. 找到您需要存储视频的存储桶,并单击右侧操作栏的【管理】,然后进入相应存储桶管理页面。
  3. 单击左侧导航栏【内容识别】,然后单击上方的【语音识别】,进入语音识别页面,单击编辑将状态修改为“开启”并单击【保存】,即可开启语音识别服务。
  4. 开通服务后,系统会自动创建一个队列。当用户使用语音识别 API 创建任务并提交后,任务会先进入队列中进行排列,系统将根据优先级和提交顺序依次执行。详情请查看 创建语音识别任务 API 文档。
目录