专栏首页人称T客语音控制:企业计算的下一个重大突破

语音控制:企业计算的下一个重大突破

如果说2007年 iPhone 的发布开启了近十年来消费者信息传达被屏幕和视觉统治的时代,那么,语音将成为继智能手机之后企业科技界下一个最大的颠覆。

苹果Siri、谷歌助手、微软小娜、三星Bixby和亚马逊Alexa等各类设备和语音助手如雨后春笋般地出现,便折射出了一种趋势的变化:越来越多的用户,开始从屏幕靠视觉传达,转向用声音来传递和接受信息。

据 Strategy Analytics 的分析师透露,智能音箱已经成为了近年来发展最快的新硬件市场。到 2023 年,63% 的美国家庭至少保有一台智能音箱,而这个数字在 2014 年是 0.03%,2017 年是 16%。

语音技术在企业市场的应用潜力巨大

在过去的几十年里,随着技术的不断成熟,从穿孔卡片到键盘再到电脑鼠标设备的缓慢发展,计算机交互已经慢慢变得更加自然。

目前,触控界面几乎成了从相机到汽车在内的任何带有屏幕的设备的默认标准。现在也是时候迈出科技界的另一大步了:和公司的设备交谈。至少在很多电影中,人类已经实现了与电脑的交谈,从《钢铁侠》中的贾维斯到《星际迷航4:暗黑无界》中的著名场景,斯科特试图向一台80年代的电脑发出指令。

尽管语音助手已经在手机上使用多年了——苹果的Siri在2011年问世。但迄今为止,它们对企业环境的影响仍然有限。

而现在,计算能力和机器学习的进步使计算机在无需繁琐的编码情况下能够比人类更好地转录语音,然后准确地翻译出来。并且,新系统可以更有效地自我更新,从错误中吸取教训,而非需要人为明确的指导。

支持语音的设备数量也在持续飙升,预计今年将售出超过5000万台,到2023年,全球语音技术产业预计将达到1265亿美元。

对于工作人员来说,语音界面能够带来很多实际的好处,尤其是与繁琐的移动键盘相比。今年早些时候,斯坦福大学、华盛顿大学和美国百度大学进行的一项研究发现,移动设备的语音输入速度几乎是打字速度的三倍,两种输入方式的错误率差别不大。

语音接口的最大好处之一是可以为企业业务系统提供“通用远程控制”。谷歌已经证明,语音可用于将计算机连接到基于人的系统,例如在美发沙龙设置预约。

这种连接在企业界甚至更有意义。因为每个大型组织都有许多不同的应用程序,倘若想要在它们之间提供一致的工作流,通常需要进行编码,这可能很慢,而且代价昂贵。但如果所有系统都支持语音,工作人员可以很容易地从一个系统切换到另一个系统,而不需要任何显式集成。

此外,企业系统之间很可能会开始相互通信。在计算中实现通用标准是非常困难的,而使用语音(尽管明显效率低下)可能是实现系统集成的一个非常实用的短期解决方案。其实,在消费级市场已经看到了这一点,最近有消息称,亚马逊的Alexa现在可以与微软的Cortana“对话”,反之亦然。

所有这些进步都意味着,那些为企业的各种业务活动提供聊天和语音接口的企业数字助理正在成为主流。

语音也成为创新服务方式的一部分。例如,Workheld提供创新的现场管理系统,以提高施工和服务流程的生产率。该公司使用机器学习和文本分析技术自动将客户工作与最合适的技术人员匹配,并提供免提语音接口,帮助员工完成维护步骤。

威胁问题不容忽视

当然,目前语音接口仍然存在一些问题,例如,在有大量背景噪音的繁忙办公室中使用它可能很难。对此,科技公司正致力于寻求解决方案:例如,使用人工智能进行更先进的降噪,在人群中挑选出你的声音,进行唇语识别,甚至直接通过你的下巴检测你的话语,而不需要你大声说出来。

不过,这也带来了一些潜在危险。例如,所有这些麦克风都为非法窃听和个人跟踪提供了充足的机会。正如乔治•奥威尔的《1984》中写道的那样:“隐藏的麦克风总是有危险的,通过它,你的声音可能会被接收和识别”。

当算法能够创造出非常精确的合成语音时,公司的安全又将如何通过语音接口来执行呢?现在很多公司的“语音诈骗”已经凸显出该问题了:如果企业首席执行官独特的(但虚假的)声音被连接到系统上,要求银行进行非正常的电汇,会发生什么?或者更贴近实际一点,如果你十几岁的女儿(假的,但听起来声音是一样的)打电话给你说她有麻烦了,需要钱,又该怎么办?!

总的来说,今年企业中的语音应用应该会有巨大的飞跃,主要是通过与聊天机器人接口的可选语音进行交互。

编辑与翻译:张苏月

本文分享自微信公众号 - 人称T客(Java_simon),作者:人称T客

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-08-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 谢亿民:创业就是人生拼搏的一个心态

    时势造英雄,创业多风口。纵观国内2010年兴起的移动互联网,2015的SaaS元年,2017年火起来的人工智能,2018年的区块链与小程序,多少人前赴后继。谢亿...

    人称T客
  • 钉钉入股蓝凌 福兮?祸兮?

    阿里钉钉入股蓝凌,让原本呈现均势的OA协同市场波澜再起,腾迅是否也会紧随其后?泛微能否成为下一个被入股的目标?OA原本就是管理软件中很小的一个细分,如今却成为互...

    人称T客
  • 用友亏损3.95亿 何时复苏需要加速核心业务变革

    从国外到国内,管理软件厂商似乎正从转型的路上找到一丝曙光,从甲骨文到SAP第三季财报显示,云计算收入成为国外两大巨头逆袭密钥,但反观国内管理软件厂商用友仍在迷茫...

    人称T客
  • 科大讯飞,站在十字路口

    在位于合肥规划中三到四平方公里的中国语音产业园,建筑机械群正在紧张作业。在竣工的讯飞大厦里,两千多名科大讯飞员工围绕“声音”忙碌着。在移动互联网的风口,...

    罗超频道
  • 干货 | 极限元算法专家:深度学习在语音生成问题上的典型应用 | 分享总结

    AI 科技评论按:深度学习在2006年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度学习在智能语音领...

    AI科技评论
  • 语音直播平台源码打造不同服务场景常用技术解决方案

    以声音这种更方便、亲近的交流方式能传递的信息比文字更多,语音、语气、语调甚至停顿长短都能反应一个人的情绪变化,不少年轻用户看来,声音可以让自己更贴切地感知到对方...

    布谷安妮
  • AI语音交互领域常用的4个术语

    语音合成标记语言的英文全称是Speech Synthesis Markup Language,这是一种基于XML的标记语言,可让开发人员指定如何使用文本转语音...

    曼孚科技
  • 语音巨头时代来临!谁将是中国Siri?

    大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

    罗超频道
  • 超过十分之一的报告篇幅给语音,互联网女皇为何看好麦克风?

    KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔的互联网趋势报告于今天正式发布。毫不夸张地说,这份报告是互联网行业分析的“超级碗”,它用200多页的Keyn...

    罗超频道
  • 神一样的文字转语音软件,不仅免费功能还强大

    之前给大家推荐过小程序分享丨智能文字转语音神器,讯飞快读这个小程序可以解决大家文字转语音的问题,小轻论坛也绑定了讯飞快读,大家可以在公众号的菜单栏打开这个小程序...

    半夜喝可乐

扫码关注云+社区

领取腾讯云代金券