首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta发布新一代多模型Llama 4

据闪德资讯获悉,Meta发布新一代多模态模型Llama 4系列,已有2款新模型可从llama.com或Hugging Face下载,分别是Llama 4 Scout、Llama 4 Maverick。

Llama 4 Scout拥有170亿有效参数和4,000亿总参数,具有多达1,000万词元(token)上下文长度。

在多项基准测试超越Google的Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1,并且可在单一NVIDIA H100 GPU 运行。

规模较大的Llama 4 Maverick性能上则媲美GPT-4o和Gemini 2.0 Flash,且在程序设计与推理任务中,使用的有效参数不到一半,表现与DeepSeek-V3 相当,可在单一H100 DGX 主机上运行便于部署。

Meta还表示,目前正在训练Llama 4 Behemoth,这被Meta CEO扎克伯格称为“全球性能最强的基础模型”。

Llama 4 Behemoth将拥有2,880亿有效参数,总参数达2万亿。

虽然这款模型尚未正式推出,但Meta表示,它在多项STEM基准测试中,将能超越竞争对手如GPT-4.5、Claude Sonnet 3.7 及Gemini 2.0 Pro。

Meta强调Llama 4采用MoE(Mixture of Experts Models,混合专家模型)架构,在训练和推理方面具有更高的运算效率。

Meta计划在4月29日举行的LlamaCon开发者大会,进一步探讨其AI模型和产品的未来计划。

闪德资讯,一个聚焦关注存储产业供应链和趋势变化的垂直媒体。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OSeRxv5-okPHOQ0HUcM43sjw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券