首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

谷歌发布史上最强开源大模型Gemma,性能超Llama-2,笔记本也能跑

这两天 AI 界真是超级热闹,前有 Open AI 扔出 Sora 炸弹,如今 Google 在没有任何预告的情况下开源了全新大模型 Gemma。

此次发布的 Gemma 相比自家的 Gemini 更加轻量级,模型权重也一并开源。不仅可以在笔记本电脑上运行,而且还免费可商用,支持中文。看来很多创业公司已经开始两眼发光了。

还不知道 Gemma 是啥的,可以跟着我们来了解一下。

Gemma 是一个轻量级、最先进的开源大模型,采用与创建 Gemini 模型相同的研究和技术构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发,灵感来自双子座,拉丁语 gemma,意思是“宝石”。除了模型权重外,谷歌还发布了一些工具,以支持开发人员创新、促进协作并指导负责任地使用 Gemma 模型。

目前 Gemma 在全球范围内可用。以下是有关 Gemma 的一些要点:

两种尺寸的模型权重:Gemma 2B 和 Gemma 7B。每种尺寸都带有预训练和指令微调的版本。

一个生成式人工智能工具包,为使用 Gemma 创建更安全的 AI 应用程序提供了指导和必要工具。

通过原生 Keras 3.0 为所有主要框架(JAX、PyTorch 和 TensorFlow)提供推理和监督微调 (SFT) 的工具链。

准备好现成可用的 Colab 和 Kaggle 笔记本电脑,以及与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等流行工具的集成,使 Gemma 入门变得容易。

经过预训练和指令调整的 Gemma 模型可以在笔记本电脑、工作站或 Google Cloud 上运行,并可以轻松部署到 Vertex AI 和 Google Kubernetes Engine (GKE) 上。

跨多个人工智能硬件平台进行优化确保行业领先的性能,包括 NVIDIA GPU 和 Google Cloud TPU。

使用条款允许负责任的商业使用和传播。

Gemini 是目前市场上最大、功能最强的人工智能模型,而 Gemma 与 Gemini 之间是共享技术和基础设施组件的。这也使得 Gemma 2B 和 7B 能够在其规模上比其他开放模型的性能更佳。

Gemma 更加轻量级,可以直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是,Gemma 在 18 个关键基准测试中,已经明显超越了当前的主流模型 Llama-2 以及 Mistral。

特别是在数学、科学和编码相关的任务中, Gemma 表现突出。

看来前段时间被 Sora 抢走的热点,这次谷歌势必要抢回来了。

就连 Google 人工智能研究员、Keras 作者 François Chollet 都说:“最强开源大模型的位置现在易主了。”

不少用户已经开始安装使用了。

发布当天短短几个小时,在 Hugging Face 上,Gemma 的 2B 和 7B 模型已经双双登顶。

全民 AI 时代真的要来了吗?

面对如此卷的 AI 界,作为普通人还是要扎实基础,不断更新技能,为未来做好准备!

大模型底层知识储备

《Python深度学习(第2版)》

[美] 弗朗索瓦·肖莱 | 著作

张亮 | 译

本书由深度学习框架 Keras 之父弗朗索瓦·肖莱执笔,通过直观的解释和丰富的示例帮助你构建深度学习知识体系。作者避免使用数学符号,转而采用 Python 代码来解释深度学习的核心思想,包括 Transformer 架构的原理和示例。

文章转编自图灵编辑部

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OdJgR7Aj1YzKAOoHxYTDSYww0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券