前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GPT-4的备胎?Mistral AI今日上线!

GPT-4的备胎?Mistral AI今日上线!

作者头像
一个正经的测试
发布2024-02-28 13:23:09
1260
发布2024-02-28 13:23:09
举报

一、 Mistral

法国人工智能独角兽 Mistral 进行对比。上周,他们神秘地在推特上发布了一个 torrent 的磁力链接。事实证明,这个 torrent 是他们新的开源模型。

不知道的人还以为是什么几个G的种子呢

链接如下

这是Mistral 的新专家混合模型:Mixtral-8x7b。

效果非常的惊人

仅次于GPT-4的大模型,秒杀GPT-3.5,而且,它更便宜

API价格比gpt-4-turbo便宜20%,输出一百万token要24美元,约173人民币元。

gpt-4-turbo同样输出一百万token要30美元,约216人民币。

两者输入token价格都是输出tokend的1/3。

在所有已能通过API访问的大模型中排第二,全班唯二在MMLU考试中拿80分以上的。

就是说,你们班,突然间转来了一个一个新生,并且在其期中考试考了全年级第二

但是,事情远远不是那么简单,因为你发现,这个新生朝中有人

二、 微软扶持的二儿子?还是OpenAI的GPT-4的备胎?

微软已与法国人工智能初创公司 Mistral 达成协议,寻求扩大其在 OpenAI 之外的快速增长行业的参与范围。

微软总裁 Brad Smith 周一宣布与总部位于巴黎的 Mistral 建立“多年合作伙伴关系”,以帮助这家成立 10 个月的公司将其人工智能模型推向市场。该协议最初由米斯特拉尔宣布。

作为交易的一部分,微软表示将投资 Mistral,但财务细节尚未披露。史密斯告诉英国《金融时报》,此次合作伙伴关系将包括研发合作,为欧洲各国政府构建应用程序,并“利用这些人工智能模型来满足公共部门的特定需求”。

此次合作使 Mistral 成为第二家在微软 Azure 云计算平台上提供商业语言模型的公司。

Mistral 联合创始人兼首席执行官 Arthur Mensch 表示:“微软对我们模型的信任是我们将前沿人工智能交到每个人手中的旅程中向前迈出的一步。”

微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 最近承认,这家总部位于巴黎的公司是在其 Azure 云计算平台上构建人工智能的创新者之一。该公司由 Mensch、Timothée Lacroix 和 Guillaume Lample(三位前 Meta 和谷歌研究人员)创立。

Mistral 致力于构建大型语言模型,这是为生成型人工智能产品提供动力的基础技术,该公司在 12 月的一轮融资中获得了20 亿欧元的估值,融资金额约为 4 亿欧元。

换句话说,微软不再独宠OpenAI了

三、 Mistral 强大在于哪里?

人工智能世界正在见证两种强大模型之间的迷人对比:Mistral,一种在法国开发的紧凑而高效的人工智能,以及 OpenAI 的 GPT-4,一种以其广泛功能而闻名的巨大模型。本文深入探讨了它们在大小、成本方面的差异,尤其是它们在多任务最大化语言理解 (MMLU) 基准测试中的性能。

比起其他模型,遥遥领先

Mistral 的精益效率:Mistral 以其 70 亿个参数而脱颖而出,这比许多同类产品要小得多。尽管如此,它仍表现出卓越的性能,尤其是其可管理性。整个 Mistral 模型大约 5 GB,因此可以在具有大约 16 GB RAM 的普通计算机上运行。

GPT-4 的资源密集型设置:相比之下,GPT-4 包含大约 1750 亿个参数,需要更加资源密集型的设置。运行 GPT-4 需要一个具有多个高端显卡的服务器基础设施,每个显卡的成本约为 20,000 美元,以托管跨度为 100 GB 到 200 GB 的模型。

MMLU 中的 Mistral 和 GPT-4:当谈到衡量模型对各种任务的理解和解决问题的能力的 MMLU 基准时,这两个模型都展示了各自的优势。GPT-4由于其庞大的规模,在存储和处理更大范围的信息方面具有先天的优势,这在MMLU任务中是有利的。然而,Mistral 在 MMLU 中的表现出人意料地具有竞争力,这表明其较小的模型并没有显着妨碍其语言理解和解决问题的能力。考虑到米斯特拉尔的规模和操作的简单性,这一点尤其令人印象深刻。

成本效益和可访问性:这些模型的运营成本和可访问性截然不同。GPT-4 要求较高的基础设施使其成为许多人难以使用的选择,主要仅限于拥有大量资源的组织。另一方面,Mistral 较小的规模和较低的运营要求为广大用户(包括小型企业和个人开发商)提供了更具成本效益且易于访问的解决方案。

四、结论

Mistral 和 GPT-4 之间的比较,特别是在 MMLU 性能方面,说明了 AI 领域的重大转变。虽然 GPT-4 仍然是复杂、资源密集型应用程序的强大工具,但 Mistral 提供了一个令人信服的替代方案,可以平衡成本、可访问性和强大的 AI 功能。这种动态强调了不仅要考虑人工智能模型的原始能力,还要考虑它们在更广泛的应用中的实用性和可访问性的重要性

不管怎么样,要是GPT-4与Mistral 之间的价格战打起来,就美妙了

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-02-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 一个正经的测试 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、 Mistral
  • 二、 微软扶持的二儿子?还是OpenAI的GPT-4的备胎?
  • 三、 Mistral 强大在于哪里?
  • 四、结论
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档