首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

句句不离AI ,谷歌自我革命!Gemini 家族大上新,AI 超级全家桶“杀疯了”

又到谷歌 I/O 的“大秀”时间。毫无疑问,AI是备受瞩目的焦点。

美东时间周二,谷歌年度 I/O 开发者大会拉开帷幕。

继OpenAI抢先一步“上新”后,谷歌开启正面回击。从新的搜索和聊天功能到面向云客户的AI硬件,谷歌一口气推出了多款AI新品。

对此,谷歌CEO皮查伊表示,谷歌所有的工作都围绕生成式AI模型Gemini来做。

每分钟都在讲 AI

去年,谷歌的I/O大会带来了Gemini;今年的I/O大会几乎每一分钟都在讲 AI。

这是Gemini 统计出来的数字——在长达 110 分钟的主题演讲中,总共提了121 次 AI 。

会上,谷歌Gemini 家族大上新。

其中,包括了AI搜索引擎、Gemini 1.5 Pro 更新版、Gemini 1.5 Flash、Gemma 2以及全新的Project Astra、Google Veo、magen 3等模型。

AI搜索引擎“AI Overviews”

谷歌正式推出“AI Overviews”搜索体验。

据介绍,AI Overviews搜素引擎具备多步骤推理能力以及计划能力。此外,靠Gemini的多模态功能,谷歌可以做到利用声音搜歌曲,利用图片搜产品。

Gemini 1.5 Pro 更新

Gemini 1.5 Pro上下文窗口扩展支持200万token,号称“迄今为止所有基础模型中最长的上下文窗口”。

谷歌还通过数据和算法的改进增强了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力。

对于复杂指令,可遵循更复杂的指令,控制回复风格,设置系统指令。

谷歌称,今年夏季将扩展 Gemini 的多模态功能,包括增加用语音进行深入双向对话的能力,这一功能被称之为Gemini Live。

目前,有超过 150 万的开发人员在使用 Gemini 模型,超过 20 亿的产品用户都用到了 Gemini。

新成员:Gemini 1.5 Flash 模型

Gemini 1.5 Flash,是谷歌追求速度和效率的轻量级模型,也是 Gemini 模型系列的最新成员。

它针对大规模、大批量、高频任务进行了优化,服务更具成本效益,并具有突破性的长上下文窗口(100 万 token )。

在应用场景上,它擅长总结、聊天、图像视频字幕、长文档数据提取等任务。Gemini 1.5 Flash通过从1.5 Pro模型中学习,继承了其核心能力。

AI助手:Project Astra

新的多模态AI项目Project Astra, 是谷歌人工智能助手的最新进展。

在演示中,AI助手可以通过视频和音频识别。例如,帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。

谷歌表示,一个真正有用的聊天机器人需要让用户“自然地与它交谈,没有滞后或延迟”。

皮查伊预计 Project Astra 将于今年晚些时候在 Gemini 启动。

新一代开源大模型 Gemma 2

谷歌开源大模型——Gemma 2 也来了。

据介绍,Gemma 2 采用全新架构,旨在实现突破性的性能和效率,新开源的模型参数为 27B。

视频大模型Google Veo、文生图像模型Imagen 3

谷歌还发布了用于生成高清视频的最新模型“Veo”,以及最高质量的文本到图像模型 Imagen 3。

据悉,Veo 能够生成各种风格的高质量 1080p 分辨率视频,时长可以超过一分钟。它可以凭借对自然语言和视觉语义的深入理解,并在理解视频内容、渲染高清图像、模拟物理原理等方面都有所突破。

Imagen 3则在生成细节、光照、干扰等方面进行了优化升级,并且理解 prompt 的能力显著增强。

AI手机系统:Android 15操作系统

在 I/O 大会上,谷歌提到了即将推出的安卓新版本,即以 AI 为核心的 Android 15。

谷歌还宣布对其适用于 Android 设备的 Gemini AI 聊天机器人进行一些改进:Gemini 正在“成为 Android 上新的人工智能助手”。

这也意味着大模型现已成为 Android 操作系统的一部分,使其能够以更全面的方式集成。

AI芯片:第六代TPU芯片Trillium

谷歌第六代TPU芯片Trillium,是迄今为止性能最强大、能效最高的 TPU,将于 2024 年底正式上线。

与 TPU v5e 相比,Trillium TPU 的每芯片峰值计算性能提高了 4.7 倍,同时它还把高带宽内存(HBM)以及芯片间互连(ICI)带宽加倍。

皮查伊表示,将于 2024 年底正式上线。

“25 年来,我们投资建设了世界一流的技术基础设施。从支持搜索的尖端硬件,到支持人工智能进步的定制张量处理单元。我们将于 2024 年末向我们的云客户提供 Trillium。”

最后

从模型到应用,再到芯片……此次谷歌年度 I/O 开发者大会让人应接不暇。

顶着Open AI压力的谷歌,这一次正面硬刚的表现还是非常出色的。

GPT-4o不仅在听、说、看 方面更“丝滑”,并且将向所有用户免费开放。

这也让市场为谷歌的“大上新”捏了一把汗。

但从现在来看,随着全家桶AI能力升级,谷歌靠着多维度反击,这一战双方势均力敌。

因为从创新方向来看,OpenAI注重AI技术的突破和飞跃,谷歌则注重生态系统的深化与整合,二者均各有所长。

当下,人工智能战场上的“厮杀”激烈。

在这场科技巨头的较量中,谷歌与OpenAI的再次交锋,也势必将人工智能的创新推向高潮。

各方科技巨头不停革新着自家的“大杀器”,也预示着AI的新一轮变革。而谷歌和Open AI的对决,远未止步于此。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OZW5WhkgTnvhxNaqZKzUOlXg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券