Anthropic 今日推出全新旗舰模型 Claude Opus 4.5,官方称其为“目前全球在编码、智能体(Agent)执行,以及电脑使用方面最强的模型”。从公开基准成绩来看,Opus 4.5 在多个任务中明显领先 GPT-5.1、Gemini 3 Pro、Grok 4.1 等主流竞品。
在核心能力上,Opus 4.5 在 SWE-Bench Verified(智能体编码)、MCP Atlas(工具使用)、OSWorld(电脑操作)、ARC-AGI 2(复杂推理)等基准上均取得显著领先。其中,智能体编码得分达 80.9%,远高于 GPT-5.1 的 76.3%。在工具使用与电脑操作场景中,Opus 4.5 同样展现出了更强的执行力与稳定性。
Anthropic 同步宣布,Excel 版 Claude 已进入 Beta 测试。企业级用户可在 Excel 内直接调用 Claude,让 AI 参与数据处理、格式化、公式校验与文档解释工作,从而使“AI 直接在软件里完成任务”成为现实。
目前,Opus 4.5 已在 Anthropic API 以及三大主流云平台上线,面向开发者和企业全面开放。Anthropic 表示,Opus 4.5 展示了“AI 系统下一阶段能力的预览”,未来将围绕自动化工作流与复杂长链任务继续扩展。
AI 的下一场战争不在聊天,而在“谁能真正帮人把事做完”, Claude 显然已经抢先一步。(转载自AI普瑞斯)
更多AI资讯请点击:http://www.aipress.com.cn/