首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta多模态大模型mcp开始用了

当地时间4月5日,Meta公司发布了最新的开源人工智能软件Llama 4的首批大模型版本Llama 4 Scout和Llama 4 Maverick。

这也是该公司迄今为止最强大的两款AI大型语言模型。

Llama 4 Scout支持1000万token上下文,适配单个H100 GPU,拥有170亿激活参数、16个专家和1090亿总参数,在文档总结和代码推理等任务中表现出色。

Llama 4 Maverick拥有170亿激活参数、128个专家和4000亿总参数,主打性价比,在推理效率与性能上对标GPT - 4o和DeepSeek V3,在编程、数学、创意写作等任务中得分领先。

此外,Meta还预告了Llama 4 Behemoth,称其为“全球最聪明的语言模型之一,将作为未来模型训练的教师模型”。

该模型拥有2880亿激活参数和近两万亿总参数,仍处于训练中。

Llama 4的Scout和Maverick版本在性能上各有特点,以下是它们与其他一些模型的对比:

• Llama 4 Scout:拥有1090亿参数,170亿激活参数,16个专家。最大亮点是支持1000万上下文,可处理20多小时的视频,仅在单个H100 GPU(Int4量化后)上就能运行。在基准测试中,性能超越Gemma 3、Gemini 2.0 Flash - Lite、Mistral 3.1,也击败了OpenAI的一些模型,适用于文档分析、多轮对话、代码等任务。

• Llama 4 Maverick:共有4000亿参数,170亿激活参数,128个专家,上下文窗口100万+。在大模型LMSYS排行榜上ELO得分1417,仅次于闭源Gemini 2.5 Pro,在硬提示、编程、数学、创意写作、长查询和多轮对话中并列第一,仅在样式控制下排名第五。其推理编码能力与DeepSeek - v3 - 0324相当,但激活参数量不到后者一半,在图像精准理解和创意写作方面表现突出,推理成本仅为GPT - 4o的十分之一,适合通用助手、聊天类应用场景。

另外,尚未发布的Llama 4 Behemoth在STEM基准测试中,性能优于GPT - 4.5、Claude Sonnet 3.7、Gemini 2.0 Pro。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OdqPXnTFfr8_6YnyFobtGwjQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券