前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【玩转腾讯云】语音转文字,轻松写笔记

【玩转腾讯云】语音转文字,轻松写笔记

原创
作者头像
tonglei0429
修改2021-05-07 10:07:04
4.1K0
修改2021-05-07 10:07:04
举报

没天总是不停的开会,会议内容又多又发散!音频文件整理困难,搜索不到终点,占用空间大,不利于分享和传达!

想把语音转换成文字,但是转写太耗时了,稍不留神又要倒回去从新听,每天好累!

怎么办?试试腾讯云的语音转文字功能呀!

语音识别功能入口

https://console.cloud.tencent.com/asr

什么是语音识别?

语音识别,就是把听到的内容用文字表达出来。

腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

什么时候会用到语音识别?

对学生党来说,课堂内容的转写会用到语音识别,对行政党来说,领导的每次讲话也会用到语音转写。

语音识别支持哪些形式?

可以实时转写,也可以将录音文件转写。

语音识别支持哪些语音?

中文✅,英文✅,日文✅,韩文✅,方言✅

说到这里,想不想体验一下语音识别的功能?

微信扫一扫
微信扫一扫

进入小程序,使用语音识别,试一试识别中文【你好,世界】

普通话

再试一试英文【哈喽,卧得】

视频内容

最后试一试粤语【磊吼,色盖】

视频内容

神不神奇~

我们再试一下文件的转写以及接口的调用。

接口说明在此处:https://cloud.tencent.com/document/product/1093/37822

最简单的实现方法:发一个 POST 请求就好了~

直接上代码

代码语言:javascript
复制
POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: CreateRecTask
X-TC-Timestamp: 1599142560
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6B2xxxxx/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=524ed61a4a71de417f4fa41249dcb428a0c51013890f24f3492068ca7cd16953

{
    "ChannelNum": 1,
    "EngineModelType": "16k_zh",
    "ResTextFormat": 0,
    "Data": "eGNmYXNkZmFzZmFzZGZhc2RmCg==",
    "SourceType": 1
}

注意几个参数:

SourceType = 1 代表使用语音数据,这时候需要加 Data 参数,而 Data 参数就是录音的文件内容。

把这段请求发到哪里?

这里 ↓↓↓

代码语言:javascript
复制
asr.tencentcloudapi.com

最后你将得到这样的输出:

代码语言:javascript
复制
{
  "Response": {
    "RequestId": "3c140219-cfe9-470e-b241-907877d6fb03",
    "Data": {
      "TaskId": 1396665
    }
  }
}

请保存好 TaskID 的值,稍作等待,我们就可以去服务端索取刚刚转写的内容了。

继续发送请求:

代码语言:javascript
复制
POST / HTTP/1.1
Host: asr.tencentcloudapi.com
Content-Type: application/json; charset=utf-8
X-TC-Version: 2019-06-14
X-TC-Region: ap-shanghai
X-TC-Action: DescribeTaskStatus
X-TC-Timestamp: 1599142563
Authorization: TC3-HMAC-SHA256 Credential=AKIDYu6A16GdCxUlnbTSVItxvhOr6Bxxxxx2/2020-09-03/asr/tc3_request, SignedHeaders=content-type;host, Signature=6647fa852c9329ac5aa355c68c838358139c2d941f4ed175dd5858978f5d79c8
Content-Length: 21

{
    "TaskId": 1396665
}

得到结果:

代码语言:javascript
复制
{
  "Response": {
    "RequestId": "a73b14a6-5044-41cb-bf32-e735d5bd69de",
    "Data": {
      "TaskId": 1396665,
      "Status": 2,
      "StatusStr": "success",
      "Result": "[0:0.020,0:2.380]  腾讯云语音识别欢迎您。\n",
      "ResultDetail": [
        {
          "FinalSentence": "腾讯云语音识别欢迎您。",
          "SliceSentence": "腾讯云 语音识别 欢迎 您",
          "StartMs": 20,
          "EndMs": 2380,
          "SpeechSpeed": 5.9,
          "WordsNum": 4,
          "Words": [
            {
              "OffsetStartMs": 120,
              "OffsetEndMs": 780,
              "Word": "腾讯云"
            },
            {
              "OffsetStartMs": 780,
              "OffsetEndMs": 1530,
              "Word": "语音识别"
            },
            {
              "OffsetStartMs": 1530,
              "OffsetEndMs": 1860,
              "Word": "欢迎"
            },
            {
              "OffsetStartMs": 1860,
              "OffsetEndMs": 2250,
              "Word": "您"
            }
          ]
        }
      ],
      "ErrorMsg": ""
    }
  }
}

至此,咱们的语音转写调用就完成啦~

是不是很简单~

更多功能咱们慢慢去挖掘~

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
作者已关闭评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档