首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Claude 4 正式发布 Opus 4 力压 Gemini 2.5 Pro

Anthropic 宣布推出全新模型 Claude 4 Sonnet 与 Claude 4 Opus,不仅立即于官方网站与 API 上线,还一口气带来重磅功能!

Claude Opus 4 力压Gemini 2.5 Pro及 o3

Claude Sonnet 4 作为 Raiku 与 Opus 之间的中阶模型,此次在编码、推理与指令理解上全面超越前代 Claude Sonnet 3.7。 更具话题的是旗舰级Claude Opus 4,其性能已被Anthropic明确对标甚至超越OpenAI的GPT-4.1、Google的Gemini 2.5 Pro与OpenAI的o3模型。 无论是多语言问答、工具作能力、终端编码还是研究所等级的推理任务,Opus 4 都展现极高水准。

Claude 去年在开发者中颇受欢迎,特别是在编码任务上表现出色。 但由于近期 OpenAI 与 Google 频繁更新,Claude 一度失去领先地位。 Anthropic此次藉由Opus 4宣示强势回归,力求夺回开发者青睐。

Claude 玩 Pokémon

Google 近期展示 Gemini 2.5 Pro 完成 Pokémon Blue 通关,而 Anthropic 也不甘示弱指出,Opus 4 虽未达同一成就,但已能自主作 Pokémon 游戏长达 24 小时,远远超越前一代仅 45 分钟的表现。 这类「agentic」作进展,显示模型能够在持续性任务中做出决策并记忆关键信息,是迈向更高智能代理人的重要一步。

Screenshot支持延伸思考与记忆

Anthropic 这次亦同步推出 beta 版延伸思考功能,允许模型在思考过程中使用如网络搜寻等外部工具,达成更具弹性与深度的推理。 此外,模型现可同时平行使用多个工具,并能更精准理解与执行指令。 在开发者允许情况下,Claude 还能访问本地档案,萃取关键事实以建立长期记忆与知识延续。

Claude Code 正式上线

受研究预览期间开发者正面回馈鼓舞,Claude Code 现已全面开放,并整合 GitHub Actions 支持背景任务。 更重要的是,已原生整合至 VS Code 与 JetBrains,允许 Claude 直接在源代码中标示与修改,强化双人编程(pair programming)体验。 开发者甚至能在 GitHub PR 中直接 @Claude 触发作,让工作流程大幅简化。

API 新功能登场

Anthropic API 现新增四大功能:代码执行工具、MCP 连接器、档案 API 与 Prompt 快取功能(最长一小时),让开发者更容易打造具持续记忆与多步推理能力的智能代理人(AI agents)。

Opus 4 与 Sonnet 4 均已通过 Anthropic API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 提供。 Opus 4 的定价为每百万 tokens 分别为 $15(输入)与 $75(输出),Sonnet 4 则为 $3 与 $15,展现不同模型层级的市场定位。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O03XT6-xIIfqauhSKqvXG9Lg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券