IT时报记者 毛宇
国内大模型赛道再迎重磅玩家。
《IT时报》记者获悉,国内AI独角兽公司MiniMax稀宇极智于10月27日发布并开源了其新一代文本大模型MiniMax-M2。这款模型在全球权威测评榜单Artificial Analysis (AA)中总分位列全球前五、开源第一,跻身全球第一梯队,与OpenAI、Anthropic、Google等硅谷巨头同台竞技。
更值得关注的是,其价格是Claude Sonnet 4.5的8%,推理速度快了接近一倍。
在当前国际大模型竞争进入深水区、行业普遍寻求商业化落地的背景下,MiniMax M2的入局,无异于在AI算力成本高企的壁垒上撕开了一道关键裂口。这意味着,中国AI企业正以“高智能+低成本”的新组合,向全球AI格局发起正面冲击。
中国首个开源跻身全球前五的大模型
根据Artificial Analysis最新榜单,MiniMax M2在编码、指令遵循和智能体(Agent)等核心任务上全面进入全球前列。
M2专为端到端开发工作流打造,在Claude Code、Cursor、Cline、Kilo Code、Droid 等多种应用中表现卓越,强大Agentic表现可以准确规划并稳定执行复杂长链条工具调用任务,协同调用Shell、Browser、Python代码执行器和各种MCP工具;通过高效地激活参数设计,实现智能、速度与成本的最佳平衡。
这标志着,中国开源模型首次在国际通用智能评测体系中达到“第一梯队”水准,真正进入“可与全球顶尖模型竞争”的阶段。
算力成本革命:高阶性能的“平价”模型
在实现高智能的同时,M2在价格上展现了强大优势。
其综合成本API价格定在每百万Token输入0.3美元/2.1元人民币,以及输出1.2美元/8.4元,同时在线上提供TPS(每秒输出Token数)在100左右的推理服务(还在快速提升)。 这个价格是Claude Sonnet 4.5的8%,而推理速度快了接近一倍,在大规模调用中保持高效响应。
M2获得了海外AI开发者对中国开源模型的一致好评。知名平台LMarena在X上向开发者推荐M2模型测试; Reddit社区技术大V在基准测试中运行了MiniMax M2,“它获得了58.3%的分数,相当不错”;CoreViewHQ 联合创始人兼CTO Ivan Fioravant 表示,“比 Claude 4.1 Opus还要好,在实际使用中也令人印象深刻”;更有海外个人开发者接入API进行了广泛测试,并在技术社区分享真实案例。
OpenRouter作为全球最具影响力的 AI 模型聚合与调用平台之一,其数据源于真实开发者的使用行为,极具代表性和权威性。M2在其平台上线不到两天,模型调用量已跻身全球前10。
MiniMax方面表示,M2专为编码与智能体任务深度优化,具备端到端开发与执行能力,可实现多代码文件的自动调试与修复。这款仅有10B激活参数(总参230B)的轻量级模型,在保持卓越性能的同时,实现了更低的延迟与成本,以及更高的吞吐效率,完美契合了新兴多智能体工作流对高效协同与快速响应的需求。
MiniMax创始人曾在2025WAIC主论坛演讲中提到:“我们希望AI不再只是大公司的特权,而是每个开发者、每家中小企业都能触及的智能基础设施。”
为“AI+”千行百业提供核心引擎
从M2深度优化的方向(编码和Agent)不难看出,这次文本模型更新清晰地指向了B端市场和开发者生态。
当前,中国正在大力推动数字经济发展,AI与实体经济的深度融合是关键路径。“AI+”赋能千行百业的背后,迫切需要一个强大的基础大模型作为核心引擎。M2的出现,为这一进程提供了强大的技术底座。凭借其在代码生成、工具调用和深度搜索方面的卓越能力,M2有望在国内金融、工业、医疗、教育、文化等众多行业的智能化转型中扮演关键角色。
例如,在金融行业,其强大的深度搜索(Deep Search)能力可用于更精准的研报分析和信息挖掘;在工业领域,其代理(Agentic)能力能够出色地规划执行复杂工具链,用于优化工厂生产流程和自动化运维;在软件开发领域,具备专业代码编程能力的它则快速化身为“超级程序员”。
为了加速这一规模化普及进程,MiniMax在发布后两周内开放全球API接口免费调用;同步上线国内版MiniMax Agent,它拥有高效与专业双模式——前者适配轻量级对话、基础编码等场景,后者则针对全栈开发、专业PPT制作等复杂需求优化,实现不同场景下的高效化,同样,MiniMax Agent在网页端与app限时免费,将普惠进行到底。