机器之心报道
编辑:泽南、小舟
谷歌大模型的新篇章翻开一页 —— 这还只是 Ultra 的 1.0 版。
时代变了。
北京时间 2 月 8 日晚,随着桑达尔・皮查伊(Sundar Pichai)的一声宣布,谷歌大模型体系全面进入了 Gemini 时代,并带来最新的 Gemini Ultra 模型。
距离 Bard 推出还不到一年,谷歌的所有生成式 AI 服务这次实现了改头换面。
原来的 Bard 网站已经改为 Gemini:https://gemini.google.com/app
在去年 12 月 Gemini 系列的发布时,谷歌已经预告过能力最强的 Gemini Ultra 大模型。当时推出的 Gemini Pro 性能被认为大致相当于 GPT-3.5 的水平,因此并没有被认为是颠覆性的革新。
在体量最大版本 Gemini Ultra 上,谷歌据称动用了 GPT-4 五倍的算力进行训练。由于 Gemini 是一款「原生」的多模态大模型,它拥有很多以往大模型前所未有的能力,在一些领域里甚至超过了 GPT-4。
现在,谷歌还在证明它可以超越人类。
皮查伊表示,Gemini Ultra 1.0 是第一个在 MMLU(大规模多任务语言理解)超越人类专家的 AI 模型,这是一个结合了 57 个科目 —— 包括数学、物理、历史、法律、医学和伦理学,用来测试大模型知识和解决问题能力的基准。
Gemini Ultra 不仅可以与人类进行更长期、更复杂的对话,还具有更好的记忆能力,这催生了一系列新的应用方向,例如:
它可以成为用户的私人导师 —— 根据你的学习风格创建分步说明、小测验或复习内容。
实现更高级的代码,扩充你的思路灵感,并帮你评估不同的编码方法。
它可以帮助内容创作者生成新鲜内容、分析最新趋势并用集思广益改进方法来扩大受众群体。
Gemini Ultra 的应用则覆盖数以亿计用户的谷歌产品,也可以通过 API 支持不断涌现的第三方新应用。
因为 Gemini Ultra 的落地,Bard 现在被统称为 Gemini,而 Ultra 版本的能力被称为 Gemini Advanced,可以在大模型推理、指令、编码和创造性协作方面带来能力超强的新体验。
谷歌的订阅式服务 Google One 获得了 Gemini Ultra 1.0 的加持,通过新的 Google One AI Premium 计划,你就可以开始使用 Gemini Advanced,同时也包括更大的存储空间和一些额外的产品功能,包括在 Google Workspace 应用程序,如 Docs 、幻灯片、表格和会议中访问 Gemini 助手的能力。
其中的很大一部分功能,以前被称为 Duet AI,现在都被整合到一块了。
皮查伊表示,已有超过 100 万人正在使用 Google Docs 上的「Help me write」等自动化功能。不知在大模型能力提升之后,这个数字会增加到多少?
目前 Gemini Advanced 的价格是每月 19.9 美元,覆盖 150 余个国家和地区。20 美元每月的价格与目前的一些已有大模型 AI 服务,包括 ChatGPT Plus 持平,不过微软的 Copilot Pro 需要每月 30 美元。
与此同时,谷歌发布了 Gemini 的安卓版 App,iOS 版的 Bard 也同时获得了升级。目前,谷歌的大模型产品已支持 40 余种语言。
在安卓版的 App 上,除了常规的对话、图像识别能力之外,Gemini 也包含了比以往大模型应用更加复杂的能力。如果你用手机拍完一张照片,可以让 Gemini 进行截图,加上介绍评论。Gemini 也可以总结你接听到的电话内容,控制手机上的部分其他应用能力。
在移动端,Gemini 因为与安卓系统的高度整合可以带来更加方便的体验。除了经由 App 使用,人们现在也可以通过说「Hey,Google!」的方式呼叫 Gemini。大模型可以识别手机全局信息,帮助你刚拍摄的照片生成朋友圈文案,帮你总结正在阅读的文章,或回答有关其内容的问题。
或许过不了多久,Google Assistant 也会改名为 Gemini?
许多 Google Assistant 的语音功能也将通过 Gemini 应用实现效果提升,包括设置计时器、拨打电话和控制智能家居设备。
面向 iOS,谷歌将在未来几周内推出直接从 Google 应用访问 Gemini 的功能。
最后,谷歌表示同期更新了 Gemini 1.0 技术报告。重要更新位于第 6 节「模型训练后」和第 7 节「负责任的部署」。(Arxiv 版本将在几天后更新)。
技术报告链接:https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
随着 Gemini 的新进展,谷歌正在快速将大模型技术落地到更多产品中。皮查伊表示,Gemini 模型还将出现在 Workspace 和 Google Cloud 等人们日常使用的产品中。
参考内容:
https://blog.google/products/gemini/bard-gemini-advanced-app/
https://blog.google/technology/ai/google-gemini-update-sundar-pichai-2024/
领取专属 10元无门槛券
私享最新 技术干货