智能云上手指南:实时流式语音识别 iOS SDK

6月21日,腾讯云在2017「云+未来」峰会上推出了战略新品——智能云,宣布将腾讯积累近20年的AI能力向政府、企业和开发者开放,其中首批开放计算机视觉、智能语音识别、自然语言处理的三大核心能力。腾讯云技术社区将陆续推出系列文章,介绍普通开发者如何快速接入并使用这三大 AI 能力。

本文将为大家讲解如何上手腾讯云提供的智能语音识别服务中的实时流式语音识别,主要是 iOS 开发 SDK 的一些使用经验。

SDK 获取

实时流式语音识别的 iOS SDK 的下载地址:iOS SDK

更多示例可参考 Demo:iOS Demo

开发准备

  • 只支持 iOS 8.0 及以上版本,不支持 bitcode 版本;
  • 实时流式语音识别,需要手机能够连接网络(GPRS、3G 或 WiFi 网络等);
  • 从控制台获取 APP ID、SecretID、SecretKey,详情参考基本概念

SDK 配置

SDK 导入

iOS SDK 压缩包名称为: QCloudAAIClientSDK.zip。压缩包中包含了一个.a 静态库和一个头文件文件夹 Headers。

工程配置

在 Build Settings 中设置 Other Linker Flags,加入参数-ObjC

在工程info.plist 文件中设置:

  1. App Transport Security Settings 类型,然后在App Transport Security Settings下添加Allow Arbitrary Loads 类型 Boolean,值设为 YES
  2. 在程序中初始化 QCloudAAIClient 的实例对象 myClient ,[myClient openHTTPSrequset:YES];(程序可以支持 https)
  3. 在工程info.plist文件中添加 Privacy - Microphone Usage Description,获取系统的麦克风的权限;
  4. 在工程中添加依赖库,在 build Phases Link Binary Whith Libraries 中添加以下库:
  • libstdc++.6.0.9.tbd
  • libc++.tdb

签名获取

移动端 SDK 中用到的签名,建议由业务服务器来生成,并由移动端向业务服务器请求。业务侧服务器需要进行签名的生成,具体生成和使用请参照签名鉴权 。识别SDK签名必须实现QCloudAAIClient的 QCloudAAIGetSignDelegate 的协议,对由SDK 提供(NSString*)param,进行加密处理;

// 获取请求的签名
(NSString *)getRequestSign:(NSString*)param;

初始化

引入上传 SDK 的头文件 QCloudAAIClient .h,使用目录操作时,需要先实例化 QCloudAAIClient 对象。

方法原型

(id)initWithAppid:(NSString *)appid secretid:(NSString *)sid  projectId:(NSString *)pid ;

参数说明

参数名称

类型

是否必填

说明

appld

NSString*

项目ID,即 APP ID

sid

NSString*

项目的 SecretID

pid

NSString*

项目的 ProjectID

STEP1:初始化 QCloudAAIClient

示例

QCloudAAIClient *client= [[QCloudAAIClient alloc] initWithAppid:appid secretid:sid projectId:projectId]];

STEP2:开始语音识别

(BOOL)startDetectionWihtCompletionHandle:(QCloudAAICompletionHandler)handler stateChange:(QCloudAAIChangeHandler)stateChange;

示例


 client = [[QCloudAAIClient alloc] initWithAppid:appid secretid:sid projectId:projectId];
  client.delegate = self;
 [client startDetectionWihtCompletionHandle:^(QCloudAAIRsp *rsp) {
        if (rsp.retCode == 0) {
            UITextView *strong = temp;
            if (![t isEqualToString:rsp.voiceId]) {
                t = rsp.voiceId;
                previous = strong.text;
            }
            strong.text= [NSString stringWithFormat:@"%@%@",previous,rsp.text];
        }else{
            NSLog(@"语音识别失败code= %dmsg:%@",rsp.retCode,rsp.descMsg);
        }

    }
    stateChange:^(QCloudAAIState state) {
        UITextView *strong = dTemp;
        if (state == QCloudAAIStateOpen) {
            strong.text = [NSString stringWithFormat:@"状态:%@",@"识别中"] ;
        }else if(state == QCloudAAIStateClose){
             strong.text = [NSString stringWithFormat:@"状态:%@",@"识别停止"] ;
        }else if(state == QCloudAAIStateFail){
            strong.text = @"麦克风权限未开,识别失败";
        }
    }];

STEP3:停止语音识别

[client stop];

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏FreeBuf

维基解密公开CIA机密文档追踪工具Scribbles源码(别名为“Snowden Stopper”)

既今年三月初开始,维基解密披露了一系列CIA Vault7 文档。4月28日维基解密再度公开了该系列中名为 Scribbles 的相关文件及其源代码。Scrib...

18410
来自专栏FreeBuf

如何构建一台属于自己的基站?

? 上周我去特拉维夫(Tel Aviv)探望我的朋友结果有了一些收获,一块崭新的BladeRF(x40),即一个支持USB3.0的SDR平台,这就意味着可以同...

2249
来自专栏小俊博客

Cloudreve1.0 – 随时随地,云端等你

1211
来自专栏恰同学骚年

.NET Core微服务之基于Jenkins+Docker实现持续部署(Part 1)

  互联网软件的开发和发布,已经形成了一套标准流程,最重要的组成部分就是持续集成(Continuous integration,简称 CI) => 持续集成指的...

674
来自专栏XAI

初识Bluemix-基于Bluemix快速开发可具有Watson认知能力的IOT应用

参与IBM的“第八格”技术论坛,体验了一把基于Bluemix如何快速将一个IOT服务应用开发出来,用Node-red工具创建一个可视化应用。 NODE-RED ...

1728
来自专栏Java社区

超好用的微信工具,清理僵尸粉,群发,群管,自动回复。

1473
来自专栏Material Design组件

Human Interface Guidelines —— 活动视图(Activity Views)

3519
来自专栏FreeBuf

从一条微博揭秘“专黑大V名人”的定向攻击

前言 本月初微博上有知名大V晒出一封私信截图,私信是以某记者名义发出,要求采访该大V博主,并提供了一个网盘链接作为“采访提纲”。当博主下载网盘中存放的所谓“采访...

17710
来自专栏魏艾斯博客www.vpsss.net

域名相关知识-零基础搭建 wordpress 教程

什么是域名?域名如何购买如何解析?选择域名应该注意哪些因素?本文是 VPS 服务器建站教程第一步-域名相关知识,专门为新手写的,把域名相关知识及魏艾斯博客对域名...

782
来自专栏Timhbw博客

小白搭建博客教程之流程

2016-03-1209:03:37 发表评论 431℃热度 搭建个人博客其实说简单也简单,说难也难,当初我一个独自探索,到现在也差不多摸清门路了,因此写一个...

34410

扫码关注云+社区