Meta发布新开源模型 llama 3.1最大包含4050亿参数

文章来源：企鹅号 - deephub

Meta最近发布了名为Llama 3.1的开源AI模型，该模型的版本包括8B、70B和405B三种，其中405B版本因其惊人的4050亿参数量而成为目前最大的开源模型之一。Llama 3.1支持高达128K的上下文长度，使其能够处理长文本并具备多语言翻译能力。此外，它在多个AI基准测试中表现出色，特别是在数学、推理和长文本处理方面表现优异，与市场上顶尖的闭源模型如GPT-4o和Claude 3.5 Sonnet相媲美。

Llama 3.1的功能特色包括能够处理和理解更长的文本信息，支持多种语言，以及在解决复杂数学问题和逻辑推理方面具有强大的能力。该模型还具备在多语言翻译和跨文化交流中的出色表现，能有效执行长文本理解和处理。Meta还为这一模型提供了Llama Stack API和安全工具，推动了AI创新应用的开发。

Meta评估了Llama 3.1在超过150个基准数据集上的性能，发现405B模型在包括通用任务、知识推理、阅读理解在内的多项任务中创下了新的记录，尤其在MMLU和SQuAD的细分基准上表现突出。此外，该模型在一些AI基准测试中甚至超越了当前的领先者，如OpenAI的GPT-4o，标志着开源模型可能首次击败目前最先进的闭源LLM模型。

这些突破表明，Llama 3.1不仅在技术上达到了新的高度，而且在推动开源人工智能社区的发展方面也扮演了重要的角色。通过持续的优化和调整，Meta有望进一步释放Llama 3.1的潜力，使其在更多的基准测试中取得更好的成绩，进一步推动AI技术的前进。

发表于: 2024-07-252024-07-25 09:24:00
原文链接：https://page.om.qq.com/page/OVYCGMu9oaxbe5z2hvhW8psA0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

Meta发布新开源模型 llama 3.1最大包含4050亿参数

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐