据闪德资讯获悉,谷歌AI开放模型Gemma不断发展,全新推出Gemma 3n,在手机、笔记型电脑和平板电脑上流畅运行,可以处理音频、文本、图片和影片。
据透露,Gemma 3n可以在存储器小于2GB的设备上运行,采用Gemini Nano同款架构,但效能表现更出色。
Gemma 3n为设备端AI应用带来了惊喜。
最大亮点在于采用了GoogleDeepMind开发的Per-Layer Embeddings(PLE)技术,显著降低了模型的存储需求。
尽管参数量分别为5B和8B,但存储占用仅相当于2B和4B模型。
谷歌称,Gemma 3n的存储占用分别低至2GB和3GB。此外,通过PLE、KVC共享和进阶启动量化等技术,Gemma 3n反应速度提升1.5倍,品质也优于Gemma 3 4B版本。
Gemma 3n在非英语语言处理上也有突破,尤其在日语、德语、韩语、西班牙语和法语中表现优异,在多语言基准测试WMT24++中,该模型得分高达50.1%。
用户无需任何设置,目前可通过Google AI Studio直接在浏览器中使用Gemma 3n;开发者通过Google AI Edge整合本地功能,支持文字和图像理解与生成,未来还将扩展更多能力。
近年来,高效到可以离线运行且无需云端运算的模型在人工智能领域日益受到青睐。
它们不仅比大型模型更便宜,而且无需将数据传输到远端数据中心,从而保护了隐私。
除了Gemma 3n,谷歌健康AI开发者基金会计划发布MedGemma。
MedGemma是在分析健康相关文字和图像方面功能最强大的开放模型。
闪德资讯,一个聚焦关注存储产业供应链和趋势变化的垂直媒体。
领取专属 10元无门槛券
私享最新 技术干货