当地时间4月5日,Meta公司发布了最新的开源人工智能软件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。
这也是该公司迄今为止最强大的两款AI大型语言模型。
Llama 4 Scout支持1000万token上下文,适配单个H100 GPU,拥有170亿激活参数、16个专家和1090亿总参数,在文档总结和代码推理等任务中表现出色。
Llama 4 Maverick拥有170亿激活参数、128个专家和4000亿总参数,主打性价比,在推理效率与性能上对标GPT - 4o和DeepSeek V3,在编程、数学、创意写作等任务中得分领先。
此外,Meta还预告了Llama 4 Behemoth,称其为“全球最聪明的语言模型之一,将作为未来模型训练的教师模型”。
该模型拥有2880亿激活参数和近两万亿总参数,仍处于训练中。
Llama 4的Scout和Maverick版本在性能上各有特点,以下是它们与其他一些模型的对比:
• Llama 4 Scout:拥有1090亿参数,170亿激活参数,16个专家。最大亮点是支持1000万上下文,可处理20多小时的视频,仅在单个H100 GPU(Int4量化后)上就能运行。在基准测试中,性能超越Gemma 3、Gemini 2.0 Flash - Lite、Mistral 3.1,也击败了OpenAI的一些模型,适用于文档分析、多轮对话、代码等任务。
• Llama 4 Maverick:共有4000亿参数,170亿激活参数,128个专家,上下文窗口100万+。在大模型LMSYS排行榜上ELO得分1417,仅次于闭源Gemini 2.5 Pro,在硬提示、编程、数学、创意写作、长查询和多轮对话中并列第一,仅在样式控制下排名第五。其推理编码能力与DeepSeek - v3 - 0324相当,但激活参数量不到后者一半,在图像精准理解和创意写作方面表现突出,推理成本仅为GPT - 4o的十分之一,适合通用助手、聊天类应用场景。
另外,尚未发布的Llama 4 Behemoth在STEM基准测试中,性能优于GPT - 4.5、Claude Sonnet 3.7、Gemini 2.0 Pro。
领取专属 10元无门槛券
私享最新 技术干货