腾讯云语音识别(Automatic Speech Recognition,ASR) 为开发者提供语音转文字服务的最佳体验。语音识别服务经微信、腾讯视频、王者荣耀等大量内部业务验证,同时也在线上线下大量外部客户业务场景下成功落地,具备识别准确率高、接入便捷、性能稳定等特点。腾讯云语音识别服务开放实时语音识别、一句话识别和录音文件识别三种服务形式,满足不同类型开发者需求。
立足于腾讯庞大的社交数据平台,积累了数十万小时的语音标注数据,拥有丰富多样的语料库,为高识别率奠定数据基础。
基于多种序列神经网络结构(LSTM、Attention Model、DeepCNN),采用 Multitask 训练方法,结合T/S方式,在通用以及垂直领域有业内领先的识别精度。
提供 REST API 和 SDK,支持智能硬件、移动应用、网站、桌面客户端和物联网等多种设备终端。
现阶段已经支持中文普通话、英语、粤语和韩语语音识别,后续将陆续开放其他语种或方言的识别能力。
语音识别模型鲁棒性佳,识别精度高,抗噪声的干扰能力强,能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理。
经过微信、腾讯视频、王者荣耀等内部业务充分验证,也在大量互联网、金融、教育等领域的外部客户业务场景成功落地,日服务亿级用户,性能稳定。
相关接口文档请参考:实时语音识别接口文档
cd miniprogram npm init npm install crypto-js
添加描述
添加描述
const CryptoJs = require('crypto-js'); console.log(CryptoJS.HmacSHA1("Message", "Key"));
* 在API 密钥管理页面获取所得secretid及secretkey需确保为同一组。
若参数为:
let timestamp = Math.round(Date.now() / 1000); let params = { secretid: '你的SecretId', timestamp: Math.round(Date.now() / 1000), expired: timestamp + 90, nonce: Math.round(Math.random() * 65535), seq: 1, end: 0, res_type: 0, sub_service_type: 1, engine_model_type: '16k_zh', result_text_format: 0, voice_format: 8, //1:wav(pcm);4:speex(sp);6:silk; 8: mp3 source: 0, //默认 voice_id: 'f658c689c3b4db74', timeout: 5000, //超时时间单位为毫秒 needvad: 0, }
}
* 具体请求参数请见请求结构,需要确保参数正确,上述标注的参数需要按照请求结构中的要求设置。
function generateQueryString(params){ let keys = Object.keys(params); let qstr = ''; keys.sort(); keys.forEach(function(key) { let val = params[key]; if (key === '') { return; } if (val === undefined || val === null || (typeof val === 'number' && isNaN(val))) { val = ''; } qstr += '&' + key + '=' + val; }) return qstr.slice(1); }
const appid = 你的AppId; //type number let qstr = generateQueryString(params); //params为a 步骤中的参数 let str = 'POSTasr.cloud.tencent.com/asr/v1/' + appid + '?' + qstr;
const secretKey = '你的SecretKey'; let sha1_result = CryptoJs.HmacSHA1(str, secretKey); //此处接入Crypto的方法请见上文,str为b 步骤中的str
let bytes = toUint8Array(sha1_result); let signStr = wx.arrayBufferToBase64(bytes); function toUint8Array(wordArray) { // Shortcuts var words = wordArray.words; var sigBytes = wordArray.sigBytes; // Convert var u8 = new Uint8Array(sigBytes); for (var i = 0; i < sigBytes; i++) { var byte = (words[i >>> 2] >>> (24 - (i % 4) * 8)) & 0xff; u8[i]=byte; } return u8; }
wx.request({ url: 'https://asr.cloud.tencent.com/asr/v1/' + appid + '?' + qstr, // appid与qstr 为 b 步骤参数 data: data, //data为通过录音接口获取的原始音频数据,语音编码方式需要对应请求接口params中的voice_format字段 method: 'POST', header: { 'content-type': 'application/octet-stream', 'Authorization': signStr, //signStr为d 步骤中获得的签名串 }, success (res) { console.log(res); }, fail(err) { console.log( err) } })
欢迎使用【腾讯云智能语音】小程序插件,不需进行复杂的鉴权过程,简单接入即可在小程序中使用腾讯云语音识别能力。
原创声明,本文系作者授权云+社区发表,未经许可,不得转载。
如有侵权,请联系 yunjia_community@tencent.com 删除。
我来说两句