专栏首页新智元语音AI革命十年,不忍看,不敢看!

语音AI革命十年,不忍看,不敢看!

新智元报道

来源:voicebot

编辑:向学

【新智元导读】过去十年的10大里程碑事件,见证了语音AI十年的飞速发展,并彻底改变了人们对语音技术的看法。作为未来10年的第一年,其前景又如何?40多名语音行业专家预测了2020年的发展趋势。戳右边链接上 新智元小程序 了解更多!

过去10年彻底改变了人们对语音技术的看法。语音助手从最初的几家门店,发展到如今已融入人们生活的方方面面。为了概括十年来发生的一切,我们挑选了过去十年里每年发生的一件值得关注的事件,来突出和显示它们是如何在语音助手的发展和传播方面成为一个里程碑的。

我们已经开启新的一年与新的十年!过去这10年始于iOS App Store推出的Siri应用,结束于全球逾30亿语音助手的用户。那么语音AI第二个十年的第一年,其前景又如何?40多名语音行业专家,预测了2020年的发展趋势。

语音AI革命性的10年:10大里程碑事件见证了它的飞速发展

2010年:SIRI作为移动应用被发布,之后被APPLE收购

Siri最初是一款独立的语音助手,一款iPhone手机应用。Apple看到了Siri的潜力,并在2010年收购了该公司及其产品。从iPhone 4S开始,Apple将Siri作为其语音助手集成到每一款支持语音功能的产品中,包括其当前的智能音箱和可穿戴技术生态系统。Siri在iPhone中的早期传播,使其成为了众多人的第一个语音助手。毫无疑问,Siri在很多方面都为未来设定了标准。

2011年:Google在首页上推出语音搜索

将语音技术应用到Google搜索引擎的强大功能中,标志着该行业迈出了重要的一步。尽管语音搜索仅限于Google Chrome浏览器,但突然间一个巨大的市场就有机会尝试使用其语音与网站进行交互。Google的桌面语音搜索还为其他网站设计了一个模板。

2012年:NUANCE发布NINA语音助手

Nuance长期以来一直是语音技术领域的主要参与者,其中包括为Siri的语音识别提供强大支持。Nina现在是企业用来与客户互动的数字助理。

2013年:微软宣布推出CORTANA语音助手

2013年,微软进入语音助手领域,开局势头强劲。Cortana将成为Windows、Xbox和其他微软产品的一部分,并在其他品牌的产品中也占有一席之地。然而,在这10年末,随着微软结束Cortana面向消费者的功能,并重新调整它使之纯粹用于商业和企业,Cortana将有一个非常不同的面貌。

2014年:Amazon推出了ALEXA语音助手ECHO

Alexa可以说是目前最有影响力的语音助手,它超越了Siri或Cortana,以至于Alexa通常被用作任何语音助手的通用术语。Alexa Marketplace可能是Alexa对语音助手领域最重要的贡献。尽管痛苦不断,但Alexa在未来十年中处于有利位置。

2015年:SOUNDHOUND推出HOUNDIFY平台

普通消费者可能会将SoundHound与音乐识别应用程序相关联,但该公司的Houndify平台正在为越来越多的公司提供品牌语音助手。在Houndify出道不久后,公司筹集了1亿美元的资金,这为公司的快速增长提供了动力,也显示了语音技术方面的竞争空间是多么巨大,无论虚拟助理的名字是什么。

2016年:Google Home和Google Assistant首次亮相

Google将其从语音实验中学到的一切都用于创建Google Assistant,这挑战了Alexa的霸主地位。与Amazon的语音助手相比,Google Home和Google Assistant提供许多相同的功能,但又与Google更大的技术生态系统相集成。在Google首次亮相后数年间收购了Nest并开始认真创建智能家庭网络后,情况就变得尤为如此。Google强调将Google Assistant变成人们生活中无所不在的一部分。

2017年:百度和阿里巴巴推出语音助手和智能音箱

2017年,中国科技巨头百度和阿里巴巴都推出了自己的智能音箱,并由自己的语音助手驱动。中文语音助手的操作方式的差异也意味着语音助手没有通用的基准,即使它们都不可避免地模仿了彼此更受欢迎的功能。

2018年:三星发布BIXBY 2.0语音助手

三星在2017年推出Bixby时曾试图在语音助手市场上开拓一席之地。他们只花了六个月的时间就决定对它进行彻底改造。Bixby 2.0不仅在第一次迭代中解决了一些问题,还使语音助手重新聚焦于开发者的灵活性,并比原来更为用户个性化。三星是一个强大的品牌,但在未来十年中,Bixby及其Capsules是否能在语音助手竞争格局中杀出一条血路,尚未可知。

2019年:超过30亿的语音助手正在使用中

现在有数十亿语音助手在使用中。Juniper Research预计2月份的这一数字将达到32.5亿,2023年有望达到80亿。今天,语音助手无处不在。智能音箱和智能手机可能是与之交互的最常见方式,但是电视、汽车、办公设备甚至衣物都可以提供强大的AI语音。现在是一个随意的对话就可以订购杂货、关灯、启动汽车。无处不在伴随着更加严格的审查。在过去的一年里,关于语音助手的隐私以及安全问题的激烈争论不会消失。

46位语音行业专家对2020年语音AI的预测:新的一年,新的精彩,新的期待

语音策略的预测

DAVID CICARELLI:VOICES.COM CEO

2020年,随着Alexa Skills和Google Actions更加流行,越来越多的品牌将音效品牌纳入其整体营销策略。有趣的是,公司将如何利用尚未得到充分信任的语音技术来建立品牌信任度,我预测使用人声将是建立这种信任度的一个重要因素。在语音技术中,不仅人们偏爱人类的声音,而且人类的声音也会增加信息的保留。

KATIE MCMAHON:SOUNDHOUND总经理

我们对硬件设计的热爱将迁移到对语音接口设计的热爱上来。我预测到本十年末,我们将知道一些受人尊敬的VUI设计师的名字,他们是那些既能理解当前技术局限性和发展轨迹,又能驾驭人类学、社会学和以人为本的指导原则来设计未来的人。

PETE ERICKSON:MODEV CEO

在2020年,将会有更多类似于苹果收购Pullstring的令人惊讶的收购,以及一些B2B平台的突破。Amazon、Google、Salesforce、Apple、Adobe和其他公司,都在争夺技术和人才。我们将会在2020年看到一家主要零售商在语音领域大放异彩;“语音峰会”将会是一场飓风。

ROGER KIBBE:VIV LABS/SAMSUNG高级开发布道者

在2020年,拥有语音将开始成为公司的战略和业务差异化因素。语音正成为与社交、移动设备和网络同等水平的一流项目。已经或即将建立语音业务的公司将开始从落后者那里获得商业利益,这与网络和移动设备领域的情况非常相似。

JASON FIELDS:VOICIFY首席战略官

我相信,2020年,正式的语音战略和客户旅程地图中的内容将显著增加。

语音搜索与发现的预测

BETH STROHBUSCH:ORBITA策略传播高级副总裁

语音搜索将在2020年占据主导地位。企业将寻求新的机会来利用虚拟助手和会话式AI的力量——通过下一代SEO和会话行动呼吁,帮助消费者发现并更充分地参与到他们的品牌互动。

MARK PHILLIPS:SIMPLISPOKEN管理合伙人

可发现性是阻碍生态系统实现语音体验潜力的关键问题。尽管语音平台的市场渗透令人鼓舞,但消费者在很大程度上并不知道语音可以做什么。我不相信语音平台供应商、语音体验开发人员或企业能够单独解决这个问题。我预测,一个独立的第三方将通过一个平台来解决这个问题,这个平台将消费者、供应商、开发人员和企业聚集在一起,提供共同的价值和激励,以跨越鸿沟。

MARK TUCKER:SOAR高级架构师

随着数以百万计的智能音箱用户的到来,2020年将是一个在可发现性上取得重大进步的一年,这些所有者将开始使用这些语音应用程序。

MATT WARE:FIRST运营负责人

第三方开发者和品牌面临的主要挑战是“发现”(Discovery)。今年,Discovery将成为生态系统所有者关注的焦点。在亚洲,智能音箱三大巨头(小米、百度和阿里巴巴)的智能音箱发货量和发展已经呈现爆炸式增长。人口、资金、对数字支付的接受程度以及友好的政府环境将使这一增长及其主导地位持续下去。主要战场将是东南亚、印度、非洲和澳大利亚。

语音助手架构

TIM MCELREATH:DISCOVERY公司新兴平台技术主管

今年,第三方开发、在第一方平台模板中呈现的内容、较小的相关功能之间的交叉链接,以及向共享(但可扩展)域语言模型的转变之间的界限将变得模糊。

GIULIO CAPERDONI:VIDEMME创新负责人

状态和上下文的表示形式将从数据本身中学习,从而使用户可以向助手传授未预料到的信息,并使助手能够理解和响应意外的输入。

BRADEN REAM:VOICEFLOW CEO

我们将看到无意图的语音应用程序结构的兴起,这将使事务性用例(如语音商务)更加有效。

JOHN KELVIE:BESPOKEN创始人兼CEO

面向第三方的以领域为中心的新开发模型的兴起。最初的声音浪潮是基于以应用程序为中心的模型。但是域对用户来说更有意义,域是第三方实现的顶级意图。这也意味着用户正在定义功能边界,而不是开发人员或产品设计师。构建者必须在用户的自然表达式和请求中发现用户所在位置。为了迅速实现这一目标,平台必须提供一种使第三方公平透明地进入顶层意图的方法。第三方必须吸引用户——大量的查询和命令可能不适合他们现有的以应用程序为中心的思维方式。

MIGUEL BERGER:VOICETER PRO CEO

2020年,语音助理将开始完善应用程序的无调用开放。这将发生,因为一旦三星完全发布Bixby,它将开始获得人气,并将蔓延到其他平台。声音也将开始听起来更人性化。因此,三星、Amazon和Google的工程师将把精力集中于此。

语音应用开发和盈利

TOM HEWITSON:LABWORKS.IO创始人

2020年将是语音应用生态系统开始大赚的一年。我们不太可能在未来12个月内看到第一个语音应用独角兽,但也许我们会发现几百个“蹄印”为我们指明了方向。

BRADLEY METROCK:SCORE PUBLISHING CEO

各大科技公司之间争夺开发者注意力的竞争将会加剧,在2020年,Alexa、Google Assistant、Bixby和Siri的投资将会增加并加速功能开发。

CHARLES CADBURY:SAY-IT-NOW CEO

语音商务的持续增长,特别是以非显而易见的方式消除了客户旅程中的瓶颈。语音商务并不总是处于交易的最后一英里,但它可以在影响交易的客户决策过程中扮演非常有价值的角色。

ARTE MERRIT:DASHBOT联合创始人兼CEO

随着语音助手的不断发展,越来越多的用户和企业采用它们。随着生态系统的发展以及企业看到语音助手的价值,希望在来年有更多的举动从创新团队转移到业务部门。

边缘的语音助手

TODD MOZER:SENSORY CEO

特定领域语音助手的兴起。产品将开始配备自然语言语音助手,而无需担心隐私或互联网连接。芯片公司将发布许多支持此功能的AI芯片,其成本可用于IoT、家用电器和其他消费产品。

CARL ROBINSON:VOICE TECH PODCAST HOST

处于低资源物联网设备边缘的语音人工智能将脱颖而出;由于隐私和性能方面的原因,更多的设备将避免使用云。此外,生物识别和情感识别将改变我们使用语音助手的方式。

汽车内的语音助手

PAT HIGBIE:XAPPMEDIA联合创始人兼CEO

紧密集成到完全互联车辆中的Alexa和Google Assistant的可用性将在2020年开始达到临界点,并将加速大众使用语音助手。所有利益相关者,包括汽车制造商、语音助手平台、广播电台、流媒体服务和品牌,都需要一种对话式AI策略,才能在这种模式转变中获胜。

STEVE TINGIRIS: DABBLE LABS首席DABBLER

尽管有人预测语音助手的使用将会放缓,但到2020年,语音助手的平均日使用量将比以往任何一年都增长得多。这将主要由汽车和可穿戴设备的使用所驱动的。

MAURO DEL RIO:SOLO.FM创始人

语音助手将在汽车里随处可见。

语音助手和可穿戴/可听设备以及其他设备

STUART CRANE:VOICE METRICS创始人兼CEO

在2020年及以后的语音领域,最热门的产品之一将是声控环,从Echo Loop开始。

MAX CHILD:VOLLEY联合创始人

智能显示器的转折点已经到来。到2020年底,最常用的语音应用(除睡眠之外)将包括强大、刺激的视觉体验。

APPLE与SIRI

KATY BASS: ALTAVOX创始人兼CEO

2020年是Siri打开语音市场的一年!我们还可能看到苹果今年发布一款新产品——配备了支持语音的AR眼镜。

YANNICK OSWALD:MANGROVE CAPITAL PARTNERS合伙人

Apple已经在最近几个月中加速发布了新的语音命令,我预计他们向更广泛的开发者社区开放其语音生态系统,使初创企业可以使用先进的语音优先命令来构建应用。

JOHN CAMPBELL:RABBIT & PORK创始人兼董事总经理

我认为我们将开始看到Amazon和Google开始发布与耳塞和车载使用直接相关的Skills与Actions。苹果将推出“语音”或“ Siri语音应用程序”,该平台将不会像在Alexa Skills上看到的那样功能全面,并将与现有的应用程序商店深度集成。

ROB HAYES:VOICEFLOW产品负责人

Apple将继续开放Siri进行第三方技能开发,这将使语音作为面向消费者的应用需要运行的渠道而倍受关注。

语音与内容

DAVE KEMP:FUTURE EAR创始人

语音领域的最大突破将由媒体公司推动,这些公司以有利于语音助手及其附属硬件的新格式提供内容。Food Network Kitchen将为Discovery之类的媒体公司如何使其内容应用于多模式语音设备提供一个蓝图。

AMIR HIRSH:AUDIOBURST CEO

语音现在是众所周知的、流行的和经常使用的。2020年,重点将是为用户的日常生活服务。任何一家没有为消费者提供具有美好体验的真正价值的公司,都会被抛到路边而被遗忘。

STEVEN GOLDSTEIN:AMPLIFI MEDIA CEO

Apple Podcasts刚刚与Amazon达成了一项交易,因此该应用可与Alexa无缝协作。通用、丰田、宝马、福特和奥迪在将语音兼容性引入信息娱乐系统的公司中名列前茅。

企业中的语音助手

MILKANA BRACE:JARGON创始人兼CEO

商业用户迅速采用语音技术作为他们工作的一部分。

JON C. STINE:OPEN VOICE NETWORK执行董事

2020年,我们将开始看到企业语音使用的扩展,并遍及所有面向消费者的行业。语音助手的故事将开始——适当地——从平台和技术转向企业价值,并在2022年或更晚将全面开花。

EMERSON SKLAR:BESPOKEN首席布道官

我相信这一年,我们将最终看到以业务为中心的内部语音解决方案。Alexa forbusiness的重大采用。投资回报率是非常有吸引力的,企业最终会对语音足够熟悉,从而投资于语音自动化来优化他们的内部流程。

行业采用AI语音

AUDREY ARBEENY:AUDIOBRAIN创始人兼CEO

我的预测是,我们将看到增长最快的是医疗行业:例如合成语音、解读情感细微差别的能力、预测行为、医疗机器人、设备、家庭监控、患者/护理人员交互等。所有这些似乎都是发展最快的。我们现在有庞大的老龄化人口,护理人员和医疗保健提供者需要更多的远程监控、健康检查和互动;这样的例子不胜枚举。

JOHN THOMPSON:VOGO VOICE运营经理

到2020年,企业将开始更多地利用语音助手和智能音箱。我们认为,公司将利用自己的客户数据为客户建立更加个性化的服务,以丰富语音体验。企业还将通过语音交互和实时地理空间数据相结合来“免提”数据收集,从而提高员工效率和安全性。在公共部门,我们认为我们将看到更多的公民“智慧城市”倡议,允许公民通过智能音箱与市、县和州政府机构互动。

LUC VEUILLET:INSIGN语音主管

2022年,通过汽车、软件、机顶盒等设备,语音接收将增加。更多的垂直应用、针对特定的业务需求和上下文,将会创造出人们期待已久的杀手级应用。

语音与营销

HARISH GOLI:PANDORA音频与语音广告产品经理

基于语音的广告将成为现实(不仅仅是一项科学实验)。 用户参与的数据将使语音广告对广告商具有吸引力。

PETE HAAS:CONVERSATION CURVE创始人

我预测2020年将是2019年的延续。具有一定经验的品牌将继续改善并向用户学习。大多数用例将与客户互动。留意明年美国以外的竞争,百度等公司正在取得惊人的进步。

BENJAMIN FISHER:MAGICCO创始人

全球品牌将在2020年变得智能化。对话系统(包括语音)将使内容具有高度个性化、独立性和对话性。我认为它们会变得更加无缝衔接,并以更加无缝和自主的方式影响我们在社交媒体上和家庭中的全球对话。我还预测会有一个1亿美元的应用。

STAS TUSHINSKIY:INSTREAMATIC CEO

进入2020年,语音对话广告现在可以利用更先进的语音AI技术,来取代听众习惯的被动、通常不相关、不受欢迎的广告。

参考链接:

https://voicebot.ai/2019/12/31/the-decade-of-voice-assistant-revolution/

https://voicebot.ai/2020/01/01/voice-ai-2020-predictions-from-46-voice-industry-pros/

本文分享自微信公众号 - 新智元(AI_era)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 2019语音技术报告:语音经济规模将超移动应用

    在过去多年的键盘输入和点击手机屏幕之后,我们正在回归到最初的“用户界面”:语音。虽然我们尚未感受到语音技术带来的全部影响,但这种技术正在改变我们与数字世界互动的...

    新智元
  • 【研报】全球智能语音市场将达200亿美元,进入群雄纷争时代

    【新智元导读】国际知名市场研究公司Research and Markets 2016年5月4日发布报告《全球及中国语音产业报告,2015-2020》的修订版本。...

    新智元
  • 深度全序列卷积神经网络克服LSTM缺陷,成功用于语音转写

    【新智元导读】目前最好的语音识别系统采用双向长短时记忆网络(LSTM,LongShort Term Memory),但是,这一系统存在训练复杂度高、解码时延高的...

    新智元
  • 极限元温正棋:从前端信号处理到语音识别、对话、声纹情绪与合成,要打造智能交互闭环 | 镁客请讲

    镁客网
  • 智能互联网时代来临,最先爆发的AI应用会是语音吗?

    移动互联网之后智能互联网时代已然来临。不过,究竟什么是人工智能?AlphaGo战胜人类棋手除了可以作为谈资之外其实与大多数人没关系,用人工智能技术调度外卖配送员...

    罗超频道
  • 干货 | 极限元算法专家:深度学习在语音生成问题上的典型应用 | 分享总结

    AI 科技评论按:深度学习在2006年崭露头角后,近几年取得了快速发展,在学术界和工业界均呈现出指数级增长的趋势;伴随着这项技术的不断成熟,深度学习在智能语音领...

    AI科技评论
  • 神一样的文字转语音软件,不仅免费功能还强大

    之前给大家推荐过小程序分享丨智能文字转语音神器,讯飞快读这个小程序可以解决大家文字转语音的问题,小轻论坛也绑定了讯飞快读,大家可以在公众号的菜单栏打开这个小程序...

    半夜喝可乐
  • 语音直播平台源码打造不同服务场景常用技术解决方案

    以声音这种更方便、亲近的交流方式能传递的信息比文字更多,语音、语气、语调甚至停顿长短都能反应一个人的情绪变化,不少年轻用户看来,声音可以让自己更贴切地感知到对方...

    布谷安妮
  • 超过十分之一的报告篇幅给语音,互联网女皇为何看好麦克风?

    KPCB合伙人、享有“互联网女皇”称号的玛丽·米克尔的互联网趋势报告于今天正式发布。毫不夸张地说,这份报告是互联网行业分析的“超级碗”,它用200多页的Keyn...

    罗超频道
  • 语音巨头时代来临!谁将是中国Siri?

    大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

    罗超频道

作者介绍

精选专题

活动推荐

扫码关注云+社区

领取腾讯云代金券