首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Google I/O 2025:七个大类20+产品和更新说了点儿啥

现在的 AI 发展就像是鸡肋一样『食之无味,弃之可惜』,就拿前段时间的 Google I/O 2025 来说,很棒,但是没啥惊喜

不过想来想去这个「大事件」,还是写文章记录一下吧。

人工智能核心模型与应用

现在任何科技相关的大会,如果不谈AI是说不过去的,作为 AI 巨头的谷歌自然也不例外。 大会的重头戏也是 AI。

Gemini 2.5

首先是 Gemini 全线升级了 2.5 版本,并着重介绍了 Deep Think 模式。

Gemini Code Assist

新版本的 Gemini 也让编程变得更加简单。个人版GitHub 版Gemini Code Assist现已全面推出,均由 Gemini 2.5 提供支持。

谷歌 Vertex AI 上推出200 万 token的上下文窗口, Gemini Code Assist 开发者也可以使用这个超大窗口的上下文。 巨大的上下文窗口将帮助开发者处理大规模的复杂任务, 例如错误追踪、代码转换,以及为新用户生成全面的入门指南,帮助他们适应庞大的代码库。

Gemini 2.5 Flash 和 Pro 也在 Vertex AI 基础上进行扩展,在处理复杂任务上表现更好。

LearnLM

LearnLM 也直接融入了 Gemini 2.5,使得 Gemini 2.5 现已成为全球领先的学习模型。

LearnLM 集成:将 LearnLM 直接融入 Gemini 2.5,使其成为领先的学习模型,获得教育专家的高度评价。

Workspace

Workspace 的集成 使得 Gemini 工作效率大幅提升,

• Gmail 中的 Gemini 可以归档和整理历史邮件,多邮件的日程管理

• Google Meet 支持语音翻译

• Vids 可以将现有的Google 幻灯片转换成视频

• 自动文字记录修剪功能

• 平衡音效功能可以调整整个视频的音量

• Imagen 4 可以为设计产品模型、品牌宣传活动生成视觉冲击力强的图形

• Google 文档中推出了基于来源的写作帮助

但我想国内大部分人的主战场都不在这里,不过国内还没有哪家巨头没丝滑整合这么多产品, 需要多家产品配合使用来为我们的工作提效。

开发者工具与平台

开发者一直是 AI 技术的先行者和主要用户之一,这次发布会也少不了对开发者的支持。

Jules

自主编码代理Jules现已进入公开测试阶段。

Jules 是一款异步的代理式编码助手,可直接与您现有的代码库集成。 能够了解项目的完整上下文,并执行以下任务:

• 编写测试

• 构建新功能

• 提供音频更新日志

• 修复错误

• 更新依赖

首先 Jules 是一个云服务,如果想用的话要授权 Github 仓库给它,他会把任务后台进行规划和执行,任务完成之后你可以回到网页和他继续交互。

Firebase

Firebase Studio 现已搭载 Gemini 2.5, 借助 Firebase Studio,我们可以在整个开发过程中依靠 AI 辅助,只需输入提示即可创建功能齐全的应用, 上线短短一个多月内,社区已创建了超过 150 万个工作区!

比如我们可以把 Figma 中的应用设计导入 Firebase Studio,然后使用 Firebase 中的 Gemini 添加特性和功能, 从设计稿到代码实现只需要几句聊天对话即可。

搜索与代理智能

搜索的 AI 模式

搜索的AI 模式,类似 Kimi 或者 秘塔AI的模式,可能更智能。 会在后台同时搜索几十上百篇 文章,然后形成专业的报告,而且号称是专家级的完整引用报告

Project Mariner

Project Mariner的代理功能也引入 AI 模式,比如:

只需输入「在低层看台找到两张本周六红人队比赛的平价门票」,

• AI 模式就会启动查询扇出,

• 跨网站分析数百个潜在的门票选项,包括实时价格和库存,并处理繁琐的填表工作。

• AI 模式将为您呈现符合您确切条件的门票选项,

• 您可以选择在您喜欢的网站上完成购买

不仅节省您的时间,同时让您掌控整个过程的一切。

Google Beam: AI 优先 3D 视频通信平台

Google Beam 使用先进的 AI 立体视频模型使通话从任何角度都能呈现完全 3D 的效果。 它将标准的 2D 视频流转换为逼真的 3D 体验,让人们以更自然、更直观的方式进行连接。

还有一个语音翻译功能比较有用,可以实时翻译对话,同时保持声音、语调和表情。

AI 驱动的购物体验

技术发展的尽头也是带货。我们前面提到的AI模式也支持购物。

购物功能通过 Gemini 与购物图谱 (Shopping Graph) 结合实现, 可以帮助用户浏览商品,查找并缩小商品范围。

购物图谱目前拥有超过 500 亿条商品信息,涵盖全球零售商和本地夫妻店,每条信息都包含评论、价格、颜色选择和库存情况等详细信息。

具体的购物体验呢,大家其实可以参考淘宝、拼多多、美团、小红书,国外的电商不会比国内更好。

虚拟试穿

虚拟试穿衣服很早就上线了,这个大家已经不陌生了。只需上传一张照片,就可以虚拟试穿数无数种服装。

生成式媒体与创意工具

Veo, Imagen, Flow

最新的视频和图像生成模型 Veo 3 和 Imagen 4 大家也不陌生,Lyria 2 是音乐家进行音乐创建的更好工具。

值得一提的是 Flow,一个专为 Veo 设计的 AI 电影制作工具。 它整合了 Google DeepMind 最先进的模型:Veo、Imagen 和 Gemini,让您可以无缝创作电影级的片段、场景和故事。

可以使用自然语言向 Flow 描述你需要的镜头(演员阵容、地点、物品和风格),Flow 会将您的叙事实现成电影视频。

SynthID Detector

SynthID Detector 可以帮助确定使用 Google AI 创建的图像是否包含 SynthID 水印。

SynthID 水印的工作原理对于普通人来说,就类似于之前某个大厂从截图和邮件里面判断是哪个员工泄露传播出去的一样。

Android XR

搭载 Android XR 的眼镜与 Gemini 配对后,能够看到和听到你的一举一动,从而了解您的处境,记住你的重要事项,全天为你提供帮助。

相当于增加了一个随身助力,但是隐私和安全问题怎么解决并没有过多的提及。

Google AI Ultra 订阅

Google AI Ultra 现已在美国上市,价格为每月 249.99 美元。

Ultra 可以访问最高权限的模型,以及最高的使用限额。包含:

• Gemini

• Flow

• Whisk

• NotebookLM

• Gmail、Docs、Vids 等中的 Gemini

• Chrome 中的 Gemini

• Project Mariner

• YouTube Premium

• 以及 30 TB 存储空间。

贵是真贵,不过功能也是真的多。

开源

Gemma 3n 预览版已经发布,轻量级开源模型、移动优先、注重私密性是 Gemma 3n 的特点。

不过手机本地集成 Gemma 3n,具体有哪些场景可用,比起模型本身来说更有探讨价值。

好啦,Google I/O 2025 的亮点主要就是这些了,大家有什么感兴趣的产品可以留言和私信给我。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OKSNpmGPGaQ1fy7dBprISujQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券