VUI (语音交互)

去百度 DuerOS (度秘)面人工智能(有些噱头成分)产品岗。 HR 说要面试到年后,断断续续要面试一个月,加上三个月实习要到5月份才能实习完。 又要负责黑客马拉松举办,不如等到暑假实习。 目测实习要鸽。

语音交互界面(Voice User Interface,VUI)、手势、动作、表情交互,甚至脑机接口,都属于自然用户界面(NUI)。

一.DuerOS 相关


DuerOS 是一个对话式人工智能操作系统,为相关语音交互设备提供一个解决方案,类似于最佳实践。

一开始还是以为 TO C ,后来意识到是 TO B 的。

1.模式

可以将常用的语音助手处理模式进行一个简化。

  • 语音识别:语音到文字
  • 自然语言处理对接服务:根据关键词/语句交付给不同承接服务
  • 反馈用户处理结果:反馈语音执行结果

整体的模式其实不是很复杂。

但是 DuerOS 作为一个"系统"级别的基础设施,基于语音输入,兼容多种输入方式,包括视觉,触觉等。也就意味着处理模式的复杂度大大提升。

2.组成

DuerOS 分为:核心接入组件、开发套件、参考设计三层

核心接入组件

核心接入组件分为“系统唤醒”和“SDK 层”。

系统唤醒主要是唤醒语音助手。 SDK 层主要是不同系统环境接入,正在认证 DuerOS 的开发者,后期可以试一下。

核心接入组件以软件为主。

开发套件

开发套件包括芯片模组和麦克风阵列。 以硬件为主。

参考设计

参考设计是以工业设计为主,包括ID工业设计,MD 结构设计以及音腔设计。 偏向硬件设计。

3.承接业务

个人把后面的承接业务分为三类,首先是IOT,其次是软件服务类,最后是对话类。

IOT 类服务

因为 IOT 类服务的触发模式是非常确定的,完全可以给出一个触发的模板来触发 IOT 设备的动作。

比如“打开电视机”,“在明早8点打开空调”等。

软件服务类

将现有服务提供一个新的语音接口。

例如“购买一包薯片”,“打车到三里屯”等 其实就是将语音对接到商城以及打车服务的接口进行后续操作,将操作对接到语音交互上面。

对话类

对话类是对于语音服务的技术性要求最高的,也就是说对话机器人需要回答开放式的问题。

二.VUI


1.定义

根据Amazon Alexa的解释

A voice user interface (VUI) allows people to use voice input to control computers and devices. In short, it’s what enables voice experiences like the Star Trek computer and Alexa, Amazon’s voice service and the brain behind millions of devices including the Amazon Echo. Voice experiences are great when they offer a faster, easier, or more delightful way of doing things.

认为语音用户界面(VUI)允许用户使用语音输入来控制计算机和设备。

2.为什么 VUI 使用越来越广泛

在最近的几十年,我们可以看到几次人机交互的巨大变革,并且迅速被大众所接受。

从键盘,到点击,到拖拽,到多点触控。

每次变革,都带来了更高效的交互模式以及更低的使用门槛,从而极大了拓展了计算机的使用场景。

3.VUI 落地的催化剂

  1. Web 服务以及 IoT 设备的丰富。Web 服务提供了丰富的语音交互服务应用场景,而物联网设备则提供了无数新的感知维度的数据。
  2. 硬件设备的能力,目前的语音设备已经可以提供远场语音处理(FFVIP, far-field voice input processing)。允许人们将语音作为一个辅助输入方式。
  3. 机器学习等领域的发展自然语言理解(NLU),语音识别(ASR, Automatic Speech Recognition),语音合成(TTS,Text To Speech)相关领域发展为语音交互奠定了基础。

4.VUI 的优势

高效的交互方式就是好的交互方式。

交互方式

速度

准确度

负荷

感官维度

效率

学习成本

键盘

视觉,触觉

触控

视觉,触觉

语音

听觉

5.VUI 目前的问题

1) 远场识别

  • 多通道同步采集硬件研发
  • 前端麦克风阵列降噪算法
  • 后端语音识别与前端信号处理算法的匹配

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏互联网数据官iCDO

无需购买广告,25种方法教你驱动更多的电商流量(下)

促使紧迫感的内容效果有14%的点击打开率,59%的交易点击率,并且是其他营销邮件转化率的两倍。

9620
来自专栏BestSDK

3个方法2个准则,让你玩转小程序

2007年1月9号,乔布斯发布了第一代IPhone手机,从此拉开了移动互联网的大幕,十年后,2017年1月9日,微信小程序正式问世,张小龙选择这个时间点推出小程...

38180
来自专栏BestSDK

从细节到数据,3个案例让你搞懂运营的精髓

1. 用户体验的基础是产品价值 用户体验这个词,我们常常听到,有可能指的是产品的功能,有可能指的产品的性能,比如打开一个App,用户运行非常慢的时候你会说用户体...

29240
来自专栏携程技术中心

微分享回放 | 数据分析在携程产品设计中的应用

【携程技术微分享】是携程技术中心推出的线上公开分享课程,每月1-2期,采用目前最火热的直播形式,邀请携程技术人,面向广大程序猿和技术爱好者,一起探讨最新的技术热...

36480
来自专栏阁主的小跟班的专栏

腾讯PM独家详解小程序,给你一份商业化场景应用指南

很多人醉心于技术的细节,有些人忙于空泛的营销。却恰恰忽略了一个新事物的本质。小程序不是要取代什么,也不是要颠覆什么,其实它就是一个工具。

1.5K10
来自专栏互联网数据官iCDO

坏数据滋生不良销售线索:为B2B销售周期清理数据

引言:我们创造的数据比以往任何时候都多——但是大部分数据都不好。这对于B2B营销人员及其线索产生(Lead Generation)/销售线索意味着什么?

6420
来自专栏大数据文摘

谷歌历史上18项失败的产品

231120
来自专栏直播系统源码

短视频APP开发带飞你的创业梦

创业的本质就是找到风口,顺势而为,就像罗永浩说的那样,只要站在风口上,猪都能起飞。

25020
来自专栏编程

怎样成长为一个优秀的 Web 前端开发工程师?

前端工程师……跟其他语言方向的程序员相比,前端工程师反而更像是幕后的人,虽然名称很前端。作为一个入门简单、进阶难的工作,前端是很多程序员的选择,想要成为优秀的前...

40570
来自专栏互联网杂技

腾讯产品经理告诉你,怎么“设计”用户体验

用户体验(User Experience,简称UX)是一种在用户使用产品过程中建立起来的纯主观感受。 这个定义中提到了3个关键词,分别是「用户」、「过程中」和「...

52050

扫码关注云+社区

领取腾讯云代金券