首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta发布AI新模型系列Llama 4,首次采用“混合专家”架构!

北京时间4月6日凌晨,Meta发布人工智能新模型系列 Llama 4,包括Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。

Meta在声明中表示,Llama 4是一个多模态AI系统,能够处理和整合文本、视频、图像、音频等多种数据类型,并能在不同格式之间实现内容转换。所有这些模型都经过了 “大量未标注的文本、图像和视频数据” 的训练,以使它们具备 “广泛的视觉理解能力”。

据介绍,Scout和Maverick是该公司首款采用混合专家架构(MoE)的模型,两者均以开源形式发布。其中,Scout有170亿个活跃参数、16个“专家”模型、1090亿个总参数;Maverick也有170亿个活跃参数,但有128个“专家”模型,总参数量高达4000亿。

此外,Meta还预告了Llama  4 Behemoth,称其为“全球最聪明的语言模型之一,将作为未来模型训练的教师模型”。Llama 4 Behemoth 在多个 STEM  基准测试中的表现优于 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。

Meta表示,其人工智能助手Meta AI已在40个国家更新为使用Llama 4模型,但目前多模态功能仅在美国以英语提供。

在发布人工智能新模型系列 Llama 4时,Meta首席执行官扎克伯格指出,“我很久以前就说过,我认为开源人工智能将成为领先的模型,而随着Llama 4的推出,这一切已经开始发生。Meta AI今天得到了一次重大升级。”

据知情人士透露,Llama 3已经推出一年了,而Llama4之所以迟迟未能发布,是因为在开发过程中,该模型在技术基准上没有达到Meta的预期,尤其是在推理和数学任务方面。此外,Meta也担心其模型在模拟人类语音对话方面不如OpenAI的模型。

同时,Meta  Platforms计划在美国威斯康星州中部投资近10亿美元建立一个数据中心项目,作为其对人工智能技术的投资。今年2月份,威斯康星州已与一家使用化名的公司达成协议,开发一个数据中心,预计多年投资额为8.37亿美元。报道称,该项目背后的公司就是Meta。

据报道,随着科技巨头增加资本支出以满足运行OpenAI的ChatGPT和Google Gemini等生成式AI应用程序所需的计算能力,数据中心的投资呈现上升趋势。Meta今年已经拨款高达650亿美元用于扩展其AI基础设施。

然而,分析人士表示,美国总统唐纳德·特朗普实施的全面互惠关税可能会阻碍科技巨头在美国投资数十亿美元建设人工智能基础设施的努力,也可能破坏政府的一个关键目标。目前,Meta在威斯康星州的数据中心项目是否会受到这一政策的影响,尚待观察。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OTnUzWkiXQENae5I44AjUKug0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券