作者 | 琰琰
编辑 | 刘冰一
昨天,期待已久的Google I/O 2021在山景城如期拉开大幕。
本届大会首次采取全线上直播的形式进行。去年受疫情影响,一年一度的谷歌I/O大会被迫暂停,如今再度归来让这场年度科技盛会有了更多看点。
“我们的使命是梳理全世界的信息,并让全世界的人们都能接触并使用它们”,谷歌CEO 桑达尔·皮查伊在大会一开始便讲到。
这是Google成立21年来从未改变过的使命,基于这一使命,I/O大会每年都能为用户带来最前沿最实用的技术和产品。
当然今年也不例外。在长达3个多小时的发布会上,谷歌逐一展示了14项最新升级产品和开发工具,几乎囊括了Google所有的业务线。
在这些产品的背后,我们看到谷歌的AI色彩更浓了。整场发布会上,AI是被提及频率最高的词之一,几乎每一项产品都有强大的AI技术支持。
围绕谷歌的AI能力,整场发布会的亮点如下:
完成一份旅行攻略,你需要用到几次搜索?
如今,搜索引擎最困难的问题之一就是如何高效地完成更复杂的任务。作为谷歌最核心的业务,会上皮查伊为我们带来了一款优化搜索任务的最新模型——Multitask Unified Model(MUM),即多任务统一模型。
这款模型和BERT一样,同样采用了Transformers架构,但它要比BERT强大1000倍。
具体来说,MUM技术具有两大独特优势,一是它支持75种不同语言的训练,可以实现跨语言传输,以帮助用户更全面地获取信息和知识。语言经常是访问信息的重要障碍,MUM尝试通过跨语言传输知识来打破界限。例如,如果你不懂日语,可能就不会找到用日语写的关于富士山的重要信息,而MUM可以通过语言来源转移知识来帮你找到它,也就是说,MUM将打破不同语种在信息搜索方面的限制。
二是MUM是多模态的,这意味着它可以同时从网页、图像等不同数据类型中理解信息,产品负责人表示,未来可能进一步扩展到视频、音频等领域。多模态学习在搜索引擎中具有重要应用价值,它可以帮助我们以更少的搜索完成更复杂的任务。
同样是以登山为例,如果你想了解去亚当斯山或富士山需要做哪些准备,可以输入以下英文,MUM就可以搜索到来自Web 的相关文章、视频或者图像,通过温度、海拔、天气等更加全面的信息提供更有用的建议。
在自然语言领域,谷歌还推出了NLU最新研究成果LaMDA。
LaMDA是一个用于对话场景的语言模型,它是开放领域的,可以就任何话题展开对话。经过大量数据训练,LaMDA已经对冥王星的知识有相当多的了解。会上,产品负责人还为我们展示了一位太空爱好者与LaMDA的对话。
有关冥王星的问题,LaMDA基本能够给出合理的回答。特别的是,如果这位爱好者突然转移话题,比如说提问如何制作纸飞机,LaMDA也可以继续对话,而不需要任何重新训练。
不过,目前LaMDA仍然只是基于文本进行训练。人类在交流过程中需要通过图像、文本、语音或者视频进行信息传递。基于此,LaMDA未来还需要进一步构建多模态模型(MUM),使其能够感知不同信息类型的问题。
谷歌表示,未来他们会将这一对话功能加入Google Assistant、Search和Workspace等产品中。
在后续的介绍中,Google 还把机器学习和 AI 运用到 Google 地图、搜索、相册、语音助手、AR等多方面,帮助用户实现了更智能化的体验。
TPU 是谷歌设计的硬件加速器,可以帮助机器学习更快地训练ML 模型。第一代TPU由四颗定制的 ASIC 组成,拥有每秒 180 万亿次浮点运算的性能,以及单板 64 GB 的高带宽内存。
这些板子也可以单独使用,通过超快的特定网络构建一个每秒万万亿次浮点运算级别的ML 超级电脑,谷歌称之为「TPU pods」。
在今天的大会上,谷歌又推出了最新一代机器学习芯片TPU v4 。它由v4芯片驱动,其速度是 TPU v3 的两倍多。
图注:具有四个 TPU v4 芯片,每个 TPU v4 板都连接到 CPU 主机。
其TPU pod的计算能力可以达到每秒百亿亿次浮点计算的级别,这相当于一千万台笔记本电脑的计算之和。在此之前,想要如此效果,只有定制一台的超级计算机。
谷歌计划将TPU v4 pod配置在他们的数据中心,并使用90%或者接近90%的无碳能源进行运行。
随着摩尔定律逼近极限,量子计算成为了信息科学的下一个突破口。实现量子计算的价值不言而喻,近十年来,谷歌一直在探索如何创造一台真正的通用量子计算机。
为了达到这一目标,谷歌在加州圣巴巴拉打造了一所先进的量子AI园区,致力于建构世界一个纠错量子计算机。
基于量子叠加、纠缠特性,量子计算能够大幅提升存储容量,达到超高运算速率。而这将有助于我们研究一切需要进行大量数据运算的事物,比如天气、遗传和疾病、量子物理学等。
然而受到机械脆弱性、工程复杂性、物理环境,尤其是量子比特翻转的影响,量子计算极容易出现误差。如何确保量子计算机连续地输出可靠无误的结果,是现有研究面临的最大挑战。
谷歌表示,为了解决这一问题,他们正着手构建 1000000 个物理量子位,以使其在纠错量子计算机中协同工作。这一目标如果得以实现将是一个质的飞跃。
纠错的量子计算机的形成需要两个纠错的“逻辑量子位”一起执行量子运算,然后将数百到数千个量子位平铺起来。其中,一个逻辑量子位需要用1000个物理量子位进行编码。而这一过程需要在“量子晶体管”中进行。
目前世界上还未建造出第一个“量子晶体管”,为证明这项工作的可行性,谷歌表示是,我们需要证明参与纠错的物理量子位越多,就越能在第一时间减少错误——考虑到物理量子位极易出错的特性,这是一个至关重要的步骤。
尤其是疫情出现之后,远程办公、视频聊天、云课程成为了人们在日常生活和工作中的最主要沟通方式。通过虚拟网络增强互动的真实感,是谷歌一直在尝试解决的问题。尽管这些年来包括Gmail、Google 相册以及Google Meet在内的通讯产品都取得了长足的进步,但它们离真正面对面交谈仍相去甚远。
会上,谷歌展示了“Project Starline”项目的最新成果,通过计算机视觉、实时渲染、增强现实以及空间音频等技术,它真正跨域了虚拟网络的障碍,达到了一种面对面的真实感。
为了达到如此体验效果,他们还开发了定制深度传感器,数十个景深扫描传感器以及 65 英寸「光场显示器」,从多个角度捕捉使用者的外形和外观,然后将它们融合在一起,创建极其细致的实时3D模型。
另外,为了可以通过现有的网络发送高清超大尺寸图像,谷歌开发了新的压缩和流媒体算法,使数据减少100多倍。
对于这个新版的功能和设计理念,谷歌主要强调了两个方面,一是深度个性化。二是隐私保护。在个性化方面,谷歌为Android 12 量身定制了一种全新设计语言——Material You。从颜色、形状、光线到动画,可以说是 Android 史上最大的一次设计变化。
在功能演示中,用户能够通过自定义调色板和重新设计的小工具来完全个性化自己的手机。例如,通过自定义设计,重新设计包括通知栏、锁屏、音量控制等小工具的外观,这些颜色还可以进一步应用于整个操作系统。
谷歌表示,Material You会最先应用到今年秋季发布的Pixel新品上。未来还会进入到Google旗下从网络应用到硬件的所有产品中,包括可穿戴设备、智能显示器、物联网项目、智能家居设备,智能手机和平板电脑等。
在设计层面,Android 12上的所有的原生小部件工具的外观,更偏向于圆形和圆角矩形。这种设计风格将会融入各种Google原生和第三方的App中去。
谷歌还简化了交互过程,重新设计整个基础系统,以使 Android 设备响应速度更快、电源效率更高。
安全与隐私一直是谷歌产品设计理念中的关键要素。谷歌在会上强调,Android 12在隐私保护方面的更新可以归纳为两点:一是让用户知道安全底线在哪,二是便于用户控制自己的隐私不被滥用。
Android 12设计了一个全新的隐私仪表面板,通过单一视角,用户可以看到自己所有的权限设置,以及数据访问情况,方便用户轻松撤销某些应用程序权限。如果有App正在调用手机的摄像头或者麦克风功能,Android 12也提供了一个更明显的图标提示。
除了以上创新产品外,大会还发布了一系列重要更新和开发工具,包括远程协作工具Smart Canvas,支持共享文档和视频通话;Google地图VR视图融入更多查询功能;Google Len拍照即可获取商品信息;Wear OS 与三星Tizen 平台结合,提升电池续航和加载速度;AI健康工具识别皮肤状况等。
正如桑达尔·皮查伊在开场时的口号,“为每个人建立一个更有用的谷歌”,谷歌将最前沿的AI技术基础融入产品创新,改变着我们生活的方方面面。
官网链接:https://google-i-o-2021.prezly.com/google-io