图片来源@视觉中国
钛媒体注:本文来自《Vox》由译指禅(yizhichan007)编译,译者:Danae,钛媒体经授权转载。
谷歌于周二举办了一场发布会,推出了一项双管齐下的战略。其一是 Pixel 手机——一款完全由谷歌自主设计制造的智能机。谷歌期望推出自己的手机,为用户提供和苹果公司一致的流畅用户体验。
但谷歌战略的第二项更具原创性,并在当天受到更多关注。公司希望将语音人工智能作为人们与智能手机交互的重要途径。她设想在未来,用户可以通过语音来预订餐厅、查看照片或播放音乐,而不是去屏幕上点击或轻扫。
显然,这并不是一个全新的想法。苹果公司的 Siri,微软的 Cortana,所有主流智能手机平台都有自己的语音智能私人助理,几年前就有了。但谷歌表示,它将使其变得更好,好到人们会频繁使用这项技术。
如果谁敢夸下海口,她一定是谷歌。让 AI 好到实用,需要大量数据来“训练”复杂的机器学习算法。大数据一项是谷歌的专长。但即使谷歌训练出一个可以理解各种请求的语音人工智能,我仍然对她设想的通过语音彻底改变智能手机玩法的未来表示怀疑。
重视设计是苹果公司的企业文化。它以优雅精细的用户界面、良好的用户体验闻名于世。相比之下,谷歌更专注于提供快速可靠的在线服务。
谷歌为 Android 定下的商业模式使得 UI 部门进一步处于劣势。苹果为 iPhone 同步设计了硬、软件,使得用户可以获得流畅无缝体验。与之对应,谷歌则将 Android 作为开源软件授权给数十家智能手机制造商。这些制造商通常会自定义用户界面,导致不同 Android 手机界面不仅不统一,更有甚者,十分平庸。
iPhone 的精益求精也是其在高端市场异常受欢迎的一个重要原因,这也能解释苹果公司为什么能够为 iPhone 收取较合理的溢价。虽然 Android 手机在整个智能机市场中占份额大头,但就获取的利润而言,谷歌远低于苹果。
尽管许多 iPhone 用户同时也是谷歌搜索、地图和邮箱的忠实拥泵,但链接这些用户和谷歌服务的 iOS 系统让苹果公司拥有很高的话语权。为此,在 2014 年,谷歌向苹果支付了 10 亿美元,以维持其在 iPhone 上的默认搜索引擎地位。
尽管舞台上的高管们从没有明说,但在周二的发布会上,谷歌显然是要向高端智能机王者苹果发出挑战。显而易见,Android Pixel 是谷歌直接对标 iPhone 的竞品。
谷歌早期的 Nexus 手机系列由第三方设计和制造,与之不同的是,Pixel 的绝大部分内容将完全由谷歌操刀设计研发。谷歌希望通过“全技术栈” ,包含软件、硬件和在线服务,实现类似于苹果长期为用户提供的无缝用户体验。
但谷歌并不想惹恼 iPhone,它试图找出一种方法区分 iPhone 与自己的产品。她认为,杀手锏是一个基于语音识别和人工智能的全新用户界面。
从某种意义上说,这只是谷歌现有语音识别功能 Google Now 的升级版。苹果和微软也有类似产品,Siri 和 Cortana。但这些产品似乎并未对市场产生重大影响。
但谷歌相信这只是因为技术还不够好。谷歌一直致力于从三个方面改进其语音功能:
提高语音识别能力和准确性,并增加其对复杂请求的理解力。
致力于其他基于人工智能的技术,如高级图像识别,以扩大谷歌私人助理可以处理的范围。
将私人助理扩展到更多设备,尤其是 Google Home(一款新型无线连接扬声器,竞品是亚马逊的 Echo)。
让我们通过一个例子来理解谷歌的设想。如果你此刻想翻看去年夏天度假的照片,你需要打开照片应用程序并滑动屏幕直到特定日期。谷歌设想了一种完全不同的方法。你可以说,“嘿,谷歌,给我看看去年七月度假的照片。” Android 会理解这个请求并调取出照片。
为了实现上述目标,谷歌已经开始着手开发并完善图像识别技术。你已经可以要求谷歌相册显示包含雪、狗或特定朋友的照片。谷歌希望将这些能力,甚至更多能力,赋予私人助理,这样你就可以提出比如“向我展示 2014 年拍摄的同时包含 Lisa 阿姨和狗狗们的照片” 这样的复杂要求。
人们很容易对这种事情表示怀疑,因为现有的智能手机“私人助理”技术并不好用。人们会困惑,既然以旧的方式做事更容易,为什么还要使用新技术。但是人工智能技术正在迅速发展,谷歌坚持认为,AI 技术很快会发展地足够好,那时基于语音的个人助理一定可以派上用场。
如果基于语音的搜索变得足够强大,它会带来一种全新的交互方式。向语音助理提问,而非打开应用程序并以老式的方式找到所需信息,也许更方便容易。
对于谷歌来说这尤其是个的好消息,因为这正是这家公司的优势。实质上,这就是将搜索当做用户体验的核心。
让智能语音助手着实有效需要海量信息。计算机科学家发现,图像和语音识别等任务在拥有大量可用于“训练”的种子数据时效果最佳。人工智能系统需要学习大量有关世界的事实,以便响应复杂查询。谷歌的优势之一是收集和组织信息 —— 毕竟,它使命就是整合全球信息。
与此同时,这将减少苹果公司的优势——制作优雅、用户友好型设备的能力。如果人们与智能手机互动的主要方式变为向手机提问,那么具体什么设备将变得无关紧要——就像网络的出现使得 PC 和 Mac 之间的差异变得不那么重要一样。
谷歌也希望持续完成用户数据存储从本地到线上的迁移。Pixel 用户可以无限免费存储照片和视频。对于 Pixel 而言,这是一个强有力的卖点,但更重要的是,意味着谷歌可以为用户提供从任何设备访问其内容的权限。谷歌设想了未来的一种场景,用户吩咐他们的 Google Home 智能音箱将度假照片在电视上放映。该未来场景将发挥谷歌在线大数据管理的优势。
很容易理解为什么谷歌希望将基于语音的搜索打造成人们与手机和其他设备的核心交互方式。但即使谷歌打造了一个能够响应各种复杂请求的语音助手,我仍然对她在智能手机市场竞争中得到强有力支持表示怀疑。
谷歌的现场演示往往令人印象深刻,但也仅仅是现场演示了。也许我们应该问,使用智能语音助手可以帮助我们减少多少与手机互动的时间。
并不是所有的场合都适合与手机语音互动,这是个问题。在很多社交场所,办公室、杂货店,公交车上,周围的人们可能对你持续在手机上咆哮指令感到恼火。在这些场合下,也许你更想小心翼翼地敲击键盘或者滑动屏幕找到你要的信息。正因为此,人们仍会认为旧式的基于触屏的操作方式更为友好。
更重要的是,人们花在手机上的很多时间——绝大部分时间——并不会受到私人语音助手的影响。大家花大量时间在 Facebook,Twitter 或Instagram 上刷帖,看消息,浏览 Tinder 个人资料等等。
即使是像查找照片这样的任务,快速滚动照片缩略图查找照片通常也比描述要查找的照片更容易。一般来说,在找旧照片时通常并不记得拍摄的时间或照片里的内容。
滚动到大致的时刻,随机翻看几张照片,慢慢回忆背景,这样更有帮助。与语音查询相比,这样的查找模式在老式的触摸界面上浏览也许更快。
【作者介绍:公众号“译指禅”(yizhichan007),专注于翻译国外泛互联网领域的优质长文。】
领取专属 10元无门槛券
私享最新 技术干货