专栏首页播放刘德华的歌腾讯云语音识别之录音文件识别.net-sdk使用
原创

腾讯云语音识别之录音文件识别.net-sdk使用

接口:https://console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=CreateRecTask&SignVersion=

EngineModelType

必填: 是.

类型: String.

描述:

引擎模型类型。 电话场景: • 8k_zh:电话 8k 中文普通话通用(可用于双声道音频); • 8k_zh_s:电话 8k 中文普通话话者分离(仅适用于单声道音频); 非电话场景: • 16k_zh:16k 中文普通话通用; • 16k_zh_video:16k 音视频领域; • 16k_en:16k 英语; • 16k_ca:16k 粤语; • 16k_ja:16k 日语;

这个接口理解,其实就是

ChannelNum

必填: 是.

类型: Integer.

描述:

语音声道数。1:单声道;2:双声道(仅支持 8k_zh 引擎模型)。

这个因为是电话场景,所以我选择双通道。

ResTextFormat

必填: 是.

类型: Integer.

描述:

识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:仅支持16k中文引擎,含识别结果详情(词时间戳列表,一般用于生成字幕场景)。

SourceType

必填: 是.

类型: Integer.

描述:

语音数据来源。0:语音 URL;1:语音数据(post body)。

我的选择是黑体注明的,选择语音URL,那么语音数据(post body)要怎么传入呢

我这里将mp3文件上传转为base64编码之后

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

相关文章

  • 玩数学公式识别之0729

    用了这几个数学公式识别之后,我有几个猜想,我在想以后能不能把网页的所有数学公式都自动识别出来,然后自动转成可以粘贴复制到office的形式,哈哈太棒了。

    算法发
  • 腾讯云语音识别安卓SDK使用笔记

    腾讯云语音识别为开发者提供语音转文字服务的最佳体验。经公司内部微信、QQ 、腾讯视频、王者荣耀等大体量业务充分验证,也在大量互联网、金融、教育等领域的外部客户业...

    算法发
  • 语音识别使用-0730

    位深:每次对声音信号的采样深度,位深可以理解为采集卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。

    算法发
  • 一个典型Jetson NANO模组的非典型刷机

    大家现在都清楚Jetson NANO开发套件的模组是不带eMMc,所以刷机安装开发环境,都需要用TF卡。

    GPUS Lady
  • Linux常用命令1

    tar -zcvf /home/abc/a.tar.gz /home/abc/a.txt

    披头
  • R语言基础绘图教程——第9章:火山图和QQ图

    DoubleHelix
  • 如何优雅的实现INotifyPropertyChanged接口

    最开始见的是PostSharp的一个实现: http://doc.postsharp.net/inotifypropertychanged-add。不过Post...

    hbbliyong
  • Java常用问题排查工具

    jstack能得到运行java程序的java stack和native stack的信息

    王小明_HIT
  • WAI-ARIA无障碍网页应用属性完全展示

    WAI-ARIA指无障碍网页应用。主要针对的是视觉缺陷,失聪,行动不便的残疾人以及假装残疾的测试人员。尤其像盲人,眼睛看不到,其浏览网页则需要借助辅助设备,如屏...

    Java帮帮
  • 【Babel 小玩具】如何用 Babel 为代码自动引入依赖

    最近在尝试玩一玩已经被大家玩腻的 Babel,今天给大家分享「如何用 Babel 为代码自动引入依赖」,通过一个简单的例子入门 Babel 插件开发。

    lucifer210

扫码关注云+社区

领取腾讯云代金券