2月26日,因为开源8x7B Mistral模型而名声大噪的Mistral AI推出了自家的新旗舰大语言模型 Mistral Large。在推理能力方面,可以与 GPT-4 和 Claude 2 等其他顶级模型相媲美
深度学习自然语言处理 原创 作者:pp
此外,Mistral AI还推出了自己基于 Mistral Large 的新服务 Le Chat (https://chat.mistral.ai/chat)作为 ChatGPT,Claude 2 以及 Gemini 的竞品,目前只需邮箱注册即可免费使用
Le Chat 界面
Mistral 宣布与微软进行合作,现在可以通过以下方式获得模型:
团队将 Mistral Large 在常用基准上的性能与顶尖的 LLM 模型进行比较。涵盖推理和知识,多语言能力,数学与代码能力。
除了 Mistral Large 之外,Mistral 还发布了一个新的优化模型 Mistral Small,针对延迟和成本进行了优化。Mistral Small 的性能优于 Mixtral 8x7B,并且延迟较低,这使其成为 Mistral AI 的开放权重的模型和旗舰模型之间的中间解决方案。
Mistral Small 受益于与 Mistral Large 在 RAG 启用和函数调用方面相同的创新。我们正在简化我们的 endpoint offering 以提供以下内容:
介绍自己
介绍PPO算法
Mistral AI 的商业模式看起来越来越像 OpenAI 的商业模式,因为该公司通过付费 API 提供基于使用量的 Mistral Large。默认情况下,Mistral AI 支持 32k 个词组的上下文窗口(在英语中一般超过 20,000 个单词)。目前 Mistral Large 的费用为每百万输入tokens 8 美元,每百万输出tokens 24 美元。作为比较,目前使用 32k 标记上下文窗口的 GPT-4 的成本为每百万输入tokens 60 美元,每百万输出 tokens 120 美元。因此,Mistral Large 目前比 GPT-4-32k 便宜 5 到 7.5 倍。
[1] https://mistral.ai/news/mistral-large