首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Mistral Large 2 发布 123B模型,媲美 Llama 405B、GPT-4o和Claude 3.5

继 Meta Llama 3.1 发布后,开源大模型的竞争也越发激烈。位于法国的 AI 初创公司 Mistral AI就在今日发布了其旗舰版开源模型 Large 2。

据其官网介绍,Mistral Large 2 支持128k上下文,数十种语言和80多种编码语言。考虑到长上下文应用程序,Mistral Large 2 为单节点推理设计,它的1230亿个参数的大小允许它在单个节点上以大吞吐量运行。且Mistral Large 2 允许用户将该模型用于研究和非商业用途的使用和修改。

虽然 Mistral Large 2的参数规模只有1230亿,但其在多个关键领域展现出卓越性能,与前几日 Meta 发布的 Llama 3.1 405B 性能相当,甚至在某些方面略优于 GPT-4o 和 Claude 3.5 Sonnet。128k Token的上下文支持,其内容相当于一本300页的书籍。可以说 Mistral Large 2 是顶级模型序列中参数规模最小的模型了。

Mistral Large 2在多项基准测试中表现优异。特别是在MMLU测试中,其预训练版本达到了84.0%的准确率,与顶级商业模型不相上下。在代码生成、数学问题解决和推理能力方面,Mistral Large 2也展现出强劲实力,与GPT-4o、Claude 3 Opus等模型比肩。值得一提的是,当遇到它拿不准的问题时,它会大方的承认,而不是胡诌。这种对准确性的保证在流行的数学基准上改进的模型性能上是很有必要的。

Mistral AI还着重提升了模型的指令遵循能力和对话能力。在MT-Bench、Wild Bench和Arena Hard等基准测试中,Mistral Large 2的表现令人瞩目,显示出其在实际应用中的潜力。值得一提的是,Mistral AI特别注重提高模型输出的简洁性,这对于提升用户体验和降低运营成本至关重要。

在多语言处理能力方面,Mistral Large 2在多语言MMLU基准测试中的表现优于Llama 3.1和Cohere的Command R+模型,展现出其在跨语言应用中的优势。

Mistral Large 2还配备了增强的函数调用和检索技能,能够熟练执行并行和顺序函数调用,为复杂业务应用提供强大支持。在函数调用准确性方面,Mistral Large 2的表现超越了多个主流模型。

尽管Mistral Large 2是开源模型,但其使用受到一定限制。目前,该模型仅限于研究和非商业用途,商业使用需要获取Mistral AI的商业许可证。

Mistral Large 2 用较少的参数实现强大性能的同时,在效率和准确性等方面都有所的突破,这为大模型研究人员和大模型发展方向都有启示作用,开源大模型紧追闭源,共同推进科技进步,这就是开源的意义所在。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O2_fmUjyt_nv4-l2LtMCZ8CA0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券