Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta发布两款Llama 4人工智能模型

(爱云资讯消息)Meta正式发布Llama 4系列AI模型,新一代技术现已应用于网页端及WhatsApp、Messenger和Instagram平台的Meta AI助手。此次开放下载的两款新模型包括:可在单块Nvidia H100 GPU运行的轻量版Llama 4 Scout,以及性能对标GPT-4o和Gemini 2.0 Flash的旗舰版Llama 4 Maverick。Meta首席执行官马克·扎克伯格透露,目前仍在训练中的Llama 4 Behemoth将成为全球性能最强的基座模型。

据Meta公司称,Llama 4 Scout模型具备1000万token的上下文窗口(即AI模型的工作记忆),在广泛采用的基准测试中表现优于谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型以及开源模型Mistral 3.1,同时仍可部署在单个Nvidia H100 GPU上运行。对于更大规模的Maverick模型,Meta宣称其性能对标OpenAI的GPT-4o和谷歌Gemini 2.0 Flash,在编码和推理任务中仅使用不到一半的激活参数就达到了与DeepSeek-V3相当的效果。

与此同时,Llama 4 Behemoth拥有2880亿激活参数,总参数量达到2万亿。虽然尚未发布,但Meta表示Behemoth能在多项STEM基准测试中超越竞争对手(此处指GPT-4.5和Claude Sonnet 3.7)。

对于Llama 4,Meta称其采用了混合专家模型(MoE)架构,这种设计通过仅调用模型特定模块来执行给定任务,从而节省资源。Meta公司计划在4月29日举办的LlamaCon大会上讨论AI模型与产品的未来规划。

与以往模型一样,Meta将Llama 4系列为开源,但Llama的许可证限制一直备受争议。比如,Llama 4许可证要求月活用户超7亿的商业实体在使用模型前必须获得Meta许可。而开源倡议组织早在2023年就指出,这一条款使其不符合开源定义。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OT8CSyHHQTXJNjG-9T7enieQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券
首页
学习
活动
专区
圈层
工具