前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >全套灵云语音交互SDK,为你铺平“智能家居”之路

全套灵云语音交互SDK,为你铺平“智能家居”之路

作者头像
BestSDK
发布2018-03-01 17:44:56
1.9K0
发布2018-03-01 17:44:56
举报
文章被收录于专栏:BestSDKBestSDK

捷通华声通过为企业推出更为贴心的全套灵云语音交互解决方案,以及为开发者提供的灵云麦克风阵列SDK、灵云麦克风阵列开发板、灵云种子SDK、灵云语音识别SDK、语音合成SDK、语义理解SDK 等等众多相关语音产品。

以电视为例,从有线遥控器到利用光信号、红外线、蓝牙等的无线遥控器,各种操作快捷键的加入,也让人们体验到了控制的便捷性。

(第一款无线电视遥控器)

行业竞争的激烈催生了电视功能的多样化,遥控器上的按键也越来越多,变得越来越臃肿了。

其实很多时候,人类研发新技术的动力非常简单:懒。

于是,语音遥控器诞生了。

像乐视、小米等加入了灵云种子或使用了灵云近讲语音遥控器产品的的智能电视,可通过遥控器上的语音键,轻松实现语音搜索、语音控制等功能,受到了用户的一致好评。

实践证明,电视、空调等家电,从遥控器过渡到语音交互是个必然趋势。

在近讲语音遥控器的基础上,也有厂家尝试在电视上面布局多颗麦克风,完全摆脱遥控器,实现远场语音交互。不过,目前电视越来越窄的边框设计,以及从用户对遥控器的依赖性来看,这并不是一个很好的远场语音交互解决方案。真的“非近即远”吗?

麦克风阵列语音遥控器 亦近亦远交互无忧

捷通华声在语音交互技术以及麦克风阵列技术上的深厚积累,针对电视及空调分别推出了灵云智能电视语音交互解决方案、灵云智能空调远场语音交互方案。同时,灵云麦克风阵列开发板也正式上线灵云商城,开发者也可在灵云平台下载使用灵云麦克风阵列SDK。

灵云智能电视语音交互解决方案,包括近讲语音遥控器产品、远场语音遥控器产品、灵云种子产品(包含云+端语音识别和语义理解,语音合成功能)、灵云声纹识别产品,以及丰富的第三方接入内容,例如天气,音乐,百科,视频等资源。

其中远场语音遥控器产品为捷通华声独有的远场语音交互解决方案。这个方案中,远场语音遥控器采用环形4麦克风布局方式,可以实现360度声源定位,3到5米距离拾音,有效降低周围环境中的噪声,同时消除电视机播放的声音。

该方案一个显著的特点,就是采用了无线蓝牙通信,语音遥控器不在身边时,通过唤醒词,用户可以直接远距离语音控制,在身边时又可近讲语音搜索,真正实现了全程语音交互的体验。

由于采用了合适的芯片方案,所以该产品具有极低的功耗和极高的性价比,能够在增加产品“新技能”的同时保证成本有效控制,做到“锦上添花”而非“画蛇添足”。

灵云智能空调远场交互方案与智能电视交互方案类似,麦克风阵列直接布置在空调上实现远场语音交互也更为方便。基于不同空调的产品形态特点,采用协处理器声音处理方案、协处理器语音交互方案、主处理器语音交互等不同的方案针对性解决,从而保证效果的同时最大化控制成本。

灵云语音交互产品优势

捷通华声提供的麦克风阵列产品具有如下产品优势:

性价比极高的语音交互软硬件方案

灵活的接入方式,可以适配多种芯片平台

5米唤醒率 > 95%,误唤醒率 < 1次/24小时

线性布局阵列定向精度 < ±15°

3米识别率 > 92%,5米识别率 > 90%

高性能,低功耗芯片,符合待机功耗标准

技术支持到位,提供全套的原理图和Pcb图纸资料,专业的支持团队。

灵云语音合成支持多种本地发音人,支持定制特殊音色发音人。

产品合作方式灵活,既可以购买语音硬件,也可以购买软件授权。

提供样品测试,测试通过后,确定商务合作模式,全程参与产品研发。

多年技术积累,灵云语音交互方案已经应用于乐视、小米等众多电视、空调厂家产品中,灵云麦克阵列技术也在新松、棠棣、木爷等几十家服务型机器人中,以及长安众多智能车载产品中应用。

捷通华声通过为企业推出更为贴心的全套灵云语音交互解决方案,以及为开发者提供的灵云麦克风阵列SDK、灵云麦克风阵列开发板、灵云种子SDK、灵云语音识别SDK、语音合成SDK、语义理解SDK 等等众多相关语音产品,旨在让每一家电视、空调厂商都能低成本快速拥有语音交互技术,从而实现语音交互在家电行业的普及。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-10-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 BestSDK 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
语音合成
语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档