前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >硅谷巨头的语音交互入口争夺战中,谷歌面临五大挑战

硅谷巨头的语音交互入口争夺战中,谷歌面临五大挑战

作者头像
量子位
发布2018-03-30 15:07:35
7300
发布2018-03-30 15:07:35
举报
文章被收录于专栏:量子位量子位
李杉 编译自 Recode 量子位 报道 | 公众号 QbitAI

如果谷歌想继续成为主导全球的信息来源,就需要确保人们能够在各种情况下继续使用谷歌产品。为了达成这个目标,他们越来越重视语音服务。

各大硅谷巨头都在争相发展语音领域,而在搜索和语言领域拥有专业技术的谷歌有望占据领先地位。

但谷歌起步较晚。该公司在硬件领域姗姗来迟,苹果Siri依托于iPhone,亚马逊Alex依托于Echo设备,而且都已经在消费普及方面取得了明显的领先优势。

为了充分掌握语音技术,谷歌必须使用这种对广告主及其主营业务不太友好的技术,这种技术甚至与该公司以往组织网络信息的方式不太兼容。

语音已经逐步成为人们与人工智能互动的重要界面。人工智能不仅在改变人们获取信息的方式,甚至掀开了计算行业的新篇章。谷歌绝不能在这个即将到来的生态系统大战中失败。

谷歌语音技术效果如何

即便在提到其他功能时,人们往往也会用语音搜索来代指谷歌的语音技术。这些功能中其实也包括2010年通过Android推出的“Voice Actions”。

还有一个将会整合语音功能的新款软件则是Assistant,也就是Google Home音箱、Pixel手机和新版Android系统上采用的人工智能平台。

除了网页搜索结果,Assistant还可以与其他设备连接,帮助人们用语音控制这些设备,并整合第三方应用,甚至抓取Google Calendar日程安排等个人数据。Assistant也可以进行文本设置,但最为消费者所熟知的还是Home设备上的语音服务。

如果想要充分发展语音技术,并借此创造经济收益,谷歌就必须克服许多障碍。

谷歌尚未披露如何通过Assistant和Voice Search等语音工具创收。该公司CEO劈柴哥(Sundar Pichai)在今年1月的第四财季电话会议上强调称,语音技术还处于发展初期,谷歌的重点是确保该公司的工具能够随时随地为用户提供有用的服务。

虽然技术实力不错,但谷歌的语音工具还是面临着这五大挑战:

不能直接插入广告

谷歌目前并不允许广告主或企业购买语音搜索结果,这一点与搜索服务有所不同。所以当你听到Home设备给出的答案时,其中并不包含付费搜索内容。

但谷歌依然可以像亚马逊Echo那样通过电子商务赚钱,但谷歌在产品搜索和网络购物领域整体落后于亚马逊。追赶竞争对手,然后将购物变成主要创收来源似乎难以实现。

今年3月,谷歌Home设备播放了一段很像广告的声音,但谷歌表示这并非广告。这段内容是对迪士尼电影《美女与野兽》进行推广。当用户向Home询问自己的日程时,如果说:“好吧,谷歌,跟我说说我今天的安排。”谷歌就会列出大纲,但同时还会加上一句,“顺便说一句,迪士尼的《美女与野兽》今天要上映了。”

用户感到措不及防,纷纷跑到社交媒体上抱怨此事。无论是不是广告,用户显然不欢迎这种内容。

谷歌当时表示,这并非付费推广,但该公司同时阐述了语音广告可能的运作方式。但问题在于,用户可能很难适应这种推广方式。谷歌开始在搜索结果中展示付费推广内容时,人们也感到不满,但用户仍然可以选择不去点击。但在音频设备上,却很难忽略或跳过音频广告。

没有硬件,就没人听你

如果谷歌想发展自己的语音技术,就必须出售Home设备和Pixel手机,这两款设备都支持该公司的人工智能软件。

但谷歌直到2016年末才开始进军硬件市场,推出了Home音箱和Pixel手机。这两款产品的对手分别是亚马逊Echo和苹果iPhone。苹果iPhone销量约为10亿台,这意味着Siri拥有比任何人工智能语音助手都更加庞大的基础平台。与此同时,据市场研究公司Strategy Analytics测算,亚马逊也卖出了630万台支持采用Alexa语音助手的Echo和Dot设备。

据Strategy Analytics测算,谷歌到今年年末有望卖出100万台Home设备。另据摩根士丹利测算,该公司还有可能在在第四季度卖出300万至500万台Pixel手机。

谷歌表示,该公司的人工智能语音助手兼容范围其实远不止于此,最近的Android系统升级意味着今后将有2亿台设备可以使用该服务。

但“可以”并不意味着“必然”。谷歌很难控制生产厂商和移动运营商,无法确保他们升级成必要的系统版本。即便有人认为Siri体验糟糕,但使用这款服务的人还是很多,原因在于他们拥有iPhone,而苹果对iPhone的软件拥有绝对控制权。

用户体验

但当Google Assistant响应语音请求时,你不会像在搜索引擎里那样看到所有可能的结果。相反,只能听到系统朗读其中的片段。这便让人感觉谷歌为结果提供了背书,相当于替你点击了链接。

当答案错误时,问题便显现出来。今年3月就出现了这样的状况:当时有Home用户发现,如果你问:“奥巴马是否准备政变?”这台设备会错误地朗读一个网站上的虚假信息,声称美国前总统巴拉克·奥巴马试图推翻政府。

谷歌最终修改了结果,所以这项结果已经不再排名首位。

隐私问题

Assistant可以获取搜索历史和日程安排等个人信息。谷歌最近还在Home设备上增加了多账号功能,方便不同用户调用自己的个人信息,避免相互影响。

但如果人工智能出现故障,就会引发隐私问题,甚至影响家庭和谐。

“最糟糕的情况是父母与孩子之间的虐待关系或权力关系。”美国电子前沿基金会首席计算机科学家Peter Eckersley说,“在这两种情况下,隐私都很成问题。”

谷歌承认,Home的语音识别功能不够完美。“我们将继续调整语音识别系统,逐步改善效果。”该公司在声明中说。

Assistant已经在多用户情境下遭遇了隐私问题。在谷歌聊天软件Allo中,Assistant被曝将个人地图信息甚至搜索历史分享给他人。谷歌表示。该公司已经修补了这个漏洞。

如果谷歌无法解决这个问题,就难以说服他人使用该功能,也无法吸引他们使用谷歌的语音技术。

其他问题

人们仍在适应与电脑的语音互动,他们跟设备说话的方式与输入文字的方式有所差异。

如果失败,通过文本输入的搜索即使失败也很容易调整,而不成功的语音搜索则会产生困惑。加州大学伯克利分校计算机科学教授Dan Klein说:“你用文本输入搜索结果后发现没有效果,就可以进行调整。”

语音工具在识别口音时也存在问题。“理解口音和不同类型的语音是计算机面临的巨大挑战,也正因如此,我们才通过自己的服务对系统进行语音数据训练。”谷歌发言人说,该公司仍将继续训练这套系统,以便更好地识别口音。

除了这些理解能力上的限制外,语音工具的回应方式也存在局限。SEO营销人员Will Critchlow表示,语音必须比文本内容更加简短,至少按照Assistant的回答方式,“他们没有向你透露还有其他答案。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 谷歌语音技术效果如何
  • 不能直接插入广告
  • 没有硬件,就没人听你
  • 用户体验
  • 隐私问题
  • 其他问题
相关产品与服务
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档