首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Meta发布新开源模型 llama 3.1最大包含4050亿参数

Meta最近发布了名为Llama 3.1的开源AI模型,该模型的版本包括8B、70B和405B三种,其中405B版本因其惊人的4050亿参数量而成为目前最大的开源模型之一。Llama 3.1支持高达128K的上下文长度,使其能够处理长文本并具备多语言翻译能力。此外,它在多个AI基准测试中表现出色,特别是在数学、推理和长文本处理方面表现优异,与市场上顶尖的闭源模型如GPT-4o和Claude 3.5 Sonnet相媲美。

Llama 3.1的功能特色包括能够处理和理解更长的文本信息,支持多种语言,以及在解决复杂数学问题和逻辑推理方面具有强大的能力。该模型还具备在多语言翻译和跨文化交流中的出色表现,能有效执行长文本理解和处理。Meta还为这一模型提供了Llama Stack API和安全工具,推动了AI创新应用的开发。

Meta评估了Llama 3.1在超过150个基准数据集上的性能,发现405B模型在包括通用任务、知识推理、阅读理解在内的多项任务中创下了新的记录,尤其在MMLU和SQuAD的细分基准上表现突出。此外,该模型在一些AI基准测试中甚至超越了当前的领先者,如OpenAI的GPT-4o,标志着开源模型可能首次击败目前最先进的闭源LLM模型。

这些突破表明,Llama 3.1不仅在技术上达到了新的高度,而且在推动开源人工智能社区的发展方面也扮演了重要的角色。通过持续的优化和调整,Meta有望进一步释放Llama 3.1的潜力,使其在更多的基准测试中取得更好的成绩,进一步推动AI技术的前进。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OVYCGMu9oaxbe5z2hvhW8psA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券