功能体验

最近更新时间:2020-08-13 11:11:56

视频讲解

功能体验

该文档指导您在开通语音识别服务后,通过 语音识别控制台-功能体验 在线体验录音文件识别功能和通过手机扫码进行实时语音识别功能体验。

前提条件

在进行语音识别功能体验前,您需要先申请开通 语音识别服务 ,开通成功后,进入语音识别 功能体验 页面,按照操作步骤调用接口。

录音文件识别功能体验

  1. 选择文件来源,有两种方式供您选择,分别是上传语音文件和上传语音 URL。两种方式需要您按照产品详细信息中的 录音文件识别 要求,上传的本地语音文件不能大于5MB;语音 URL 的音频大小不超过512MB,时长不能超过5小时。
  2. 选择音频类别,电话是指手机或座机通话生成的音频,一般采样率默认为8000Hz;非电话是指非手机或座机通话生成的音频,推荐的采样率为16000Hz,两种类别音频的推荐位深都为16。您选择的音频类别,需要和您上传的音频完全匹配,才会得到正确的识别结果。如果您不知道您的录音文件的音频属性,常见的音频编辑软件均可查看音频属性,如 Adobe Audition,也可以使用开源命令行工具 FFmpeg 进行查看。
  3. 选择引擎模型,引擎模型可根据您实际音频的语言和行业来选择,如您的音频并没有对应行业的引擎模型,建议使用对应语音的通用模型进行识别。
  4. 选择结果样式,含时间戳,即识别结果带对应语音分片的起止时间;不含时间戳,则识别结果是只包含文字。
  5. 选择文件/文件地址,采用上传文件方式的话,需要选择“上传文件”进行本地文件上传;采用 URL 地址的方式的话,需要给出您语音 URL 的地址。
  6. 上传完文件后,单击【开始识别】,识别完后,单击【下载结果】即可查看语音识别的内容。

实时语音识别功能体验

  1. 手机扫码进行实时语音文件识别功能体验。
  2. 选择“语音识别”进入功能体验。
  3. 选择您需要体验的引擎模型。
  4. 按住按钮进行说话,请在完全按住后再开始说话,说完后再松开按钮。
  5. 可实时的获取识别结果。