Gemma系列是谷歌的开源大模型,2024 年 2 月发布Gemma 1,2024年5 月发布Gemma 2,今天谷歌宣布推出了最新版本 Gemma 3 ,作为其面向开发者的最新开源大模型。
Gemma 系列,去年下载量超过 1 亿次,有 60,000 个被称为“ Gemmaverse ” 的 Gemma 变体。旨在直接在手机、笔记本电脑和工作站等设备上快速运行。不过变体最多的还是中国的千问系列。
Gemma 3采用与 Gemini 2相同的技术打造而成。没有在技术架构上突破。它有 1B、4B、12B 和 27B 尺寸可供选择。 是一个参数适合的小模型。
谷歌特别强调 Gemma 3 是“世界上最好的单加速器模型”(单 GPU 或 单TPU )。具体来说,它在 LMArena 中的表现优于 Llama-405B、DeepSeek-V3 和 o3-mini。
此图表按 Chatbot Arena Elo 得分对 AI 模型进行排名;得分越高(数字越大),表示用户偏好越高。点表示估计的 NVIDIA H100 GPU 要求。Gemma 3 27B 排名靠前,且只需要一个 GPU,而其他模型则需要多达 32 个GPU。
可以看出虽然Gemma 3 的参数只有27B,却超过了DeepSeek716B参数的V3模型。V3我用过,感觉挺厉害。也超过了Llama3,这是去年的主流大模型,大约是用一年的时间实现了只用十分之一的参数达到同等能力。
它同是还是一个多模态大模型。支持图像和视频识别。支持128k 的上下文,支持超过 35 种语言,预训练支持超过 140 种语言。
Gemma 3 支持函数调用和结构化输出,以帮助您自动执行任务并构建代理体验。函数调用和结构化输出已经是大模型的主流功能。这为开发AGENT智能体提供了极大的方便。
自谷歌于 2024 年 2 月首次发布Gemma以来,人们对小参数的大模型的兴趣与日俱增。超大参数的模型虽然性能强劲,但是成本同样喜人,企业希望使用与大参数模型一样强大但是成本却急剧降低的模型构建AI应用。
现在大模型的研发主要由中国和美国主导, 中国在硬件被美国封锁的情况下依然和美国交替占据AI榜单的榜首位置。这更证明了中国研发的能力和不惧困难。勇往直前的信念。
对于现在的AI大模型发展你有什么想法,欢迎留言讨论。
领取专属 10元无门槛券
私享最新 技术干货