前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >手机AI、购物AI...还有哪个“AI+”被忽略了?

手机AI、购物AI...还有哪个“AI+”被忽略了?

作者头像
AI科技大本营
发布2018-07-23 16:22:15
4730
发布2018-07-23 16:22:15
举报

AI 技术似乎成了一把“万能钥匙”,捅进任何一个拥有数据的行业钥匙孔里,它都具有一定的适配能力。

AI 应用在手机上,提升了图像识别和语音识别的效率;AI 应用在医疗影像中,可以辅助医生进行快速阅片诊断;AI 应用在汽车里,就会是解放人类驾驶员的自动驾驶……

现在,一种人工智能同样有所作为的应用场景正在浮现,它为人们所熟悉但又知之甚少。

根据战略咨询公司 Morar HPI 的数据调查,会议给全球 94% 的工作人员带来了恐惧感。人们对开会抱怨最多的两件事是会议进行时间超过实际需求(49%),以及找出适合每个人的会议时间(39%)。用一句话来说,无非就是乏味且效率低下。

日常工作中,本来是探讨和解决问题的会议,但繁冗无意义的流程让它成了一件疲惫的事情。天生带有“高效率”光环的 AI 此时来与它进行适配了,但它能在多大程度上改变这种糟糕的体验?以及如何改变?

近年来,众多技术供应商和系统集成商为改进电话会议付出了不懈努力,会议技术的易用性得到了显著提升。但一些问题仍然长期存在,譬如使用哪个系统、如何使用该系统以及遵循怎样的流程顺序。

而在会议上,大部分会议室仍然遵循一场会议由一个“主持人”主导的方案,这绝不会是敏捷工作方法所具备的特点,这些都造成了企业在低价值工作上浪费了大量时间,会议效果或会议时长因错误或技术性问题大打折扣,同时支持成本明显上升,企业整体的灵活性和生产能力也在一定程度上受到了影响。

只要有用户需求痛点,市场自然会提供相应产品。SparkRoom 70 是思科做出的适用于会议场景的一款 AI 产品,它对会议流程进行了新一轮智能化升级,主要体现在智能语音助理和人脸识别这两大功能上。

思科协作对应不同大小会议室的四款产品

正如 Alexa 和 Siri 等语音助手一样,思科也专门打造了全球首款人工智能会议语音助手 Spark,用户可利用语音命令通过 Spark Room 70 进行语音唤醒,发起和结束预定的会议,抑或直接向某位人士拨号,如“Hi,Spark,呼叫 Sarah”。

人们最关心的或许是它的语音识别能力,尤其在会议室这种嘈杂的环境对麦克风的拾音效果有很大挑战。针对会议中可能出现的键盘声等噪音,它所使用的麦克风能自动消除并自动提高发言者的声音级别。而在参会人员发言阶段,当 Spark 识别到某一发言人声音后,会进行自动语音追踪,实现“听声辩位”,会议结束后,它还可以将会议速记分发给参会人员。不过,对于具体语音识别效果,思科方面并未有相关数据介绍。

会议期间也不用“主持人”对相关与会人员多做介绍,当他们在首次录入相关人脸信息后,屏幕上方的摄像头会对相关发言人进行人脸跟踪,并在屏幕上同步显示与会人员的姓名和职称,至于统计参会人数更是不在话下。这种人脸技术应用目前已经较为成熟,火车站快速检票、无人店分析用户需求都是基于该技术。

再看硬件配置,简洁优雅的工业设计下有强大的硬件支持,SparkRoom 70配备 70 英寸的 4K 屏幕(提供单屏和双屏两种型号)和四个 5K 摄像头。其中一个摄像头始终捕捉整个房间,支持智能取景,并能快捷显示最佳的房间全景图。SparkRoom 70 还支持企业自建模式部署和思科 Spark 云服务模式部署,但这些设置从第一款 4K 双流显示的 Spark Room Kit 就有了。新增的佐料是,前者采用了 NVIDIA Jetson 平台(众多自动驾驶车辆也采用了该平台),实现了摄像机技术和机器学习之间的平衡。

此外,Spark Room 70 能够实现全无线数据共享,无线接入将有效解决以往会议室布置中的难题,从而显著简化部署。

当然,现在的方案还只是 AI 技术在会议场景小试牛刀。在未来, AI 应用于会议领域还能提升多少业务价值?思科给出了它的战略方向,共 5 个层次:

  • 第 1 层,指令和控制:通过机器听觉和自然语言处理能力实现语音响应,从而简化会议设置机制;
  • 第 2 层,自然语言理解:通过 AI “机器人”(一种可模拟对话的机器算法)来处理各种指令,协助会议管理;
  • 第 3 层,基于领域专长的语义理解,支持系统创建和分发会议总结;
  • 第 4 层,智能团队成员:即系统理解会议情境和与会者需求的能力,通过系统的这种能力来合成相关数据,为团队提供帮助,比如通过自动创建数据表来协助决策的制定;
  • 第 5 层,团队及策略智能:即系统理解企业目标和团队成员技能,以及为与会人员提供建议的能力(比如“ Sarah 是这个领域的专家,我们是否邀请她参会?”)。

第 1、2 层级的功能已得到了实现,可预见的是,越往技术金字塔顶端,突破会更艰难,但思科的战略目标已经非常清晰,其一是 AI 技术未来在塑造会议技术方面是大势所趋,其二则是思科在技术积累上的底气。

上世纪 90 年代,思科就率先跟进机器智能前沿技术,采用了多种话筒波束成形技术,推出了具备媒体适应能力的 DX80 小型视频会议终端。如今,随着深度学习的崛起,思科的设想是应用前沿的全数字化科技以及 AI 技术,将未联接的会议室和办公室打造为全功能协作空间,并最终实现让工作人员摆脱乏味的会议设置和其他后勤工作。实现这一目标任重道远,但思科已经出发了。

题图来自:pixabay

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
图像识别
腾讯云图像识别基于深度学习等人工智能技术,提供车辆,物体及场景等检测和识别服务, 已上线产品子功能包含车辆识别,商品识别,宠物识别,文件封识别等,更多功能接口敬请期待。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档