Anthropic公司推出的新一代Claude 4模型系列,尤其是Claude Opus 4,以其强大的性能和惊人的能力,迅速成为行业内外关注的焦点。
当然了,伴随着这一系列新模型的问世,一些令人担忧的行为也随之浮出水面,引发了人们对于人工智能安全性和伦理问题的深入思考。
Claude 4模型系列包含了Claude Opus 4和Claude Sonnet 4两款重量级产品,它们在编码、高级推理和人工智能代理等多个方面展现出了卓越的实力,为整个行业树立了新的标杆。
Claude Opus 4堪称Anthropic迄今为止最强大的模型,也是全球范围内首屈一指的编码模型。在SWE工作台(72.5%)和终端工作台(43.2%)等权威基准测试中,它均取得了领先的成绩。
这一数据背后,是Opus 4在处理复杂、长时间运行任务和代理工作流时所展现出的持续稳定性能。它能够集中精力,连续工作数小时,轻松应对那些需要数千步操作的任务,大大超越了所有Sonnet模型,显著扩展了AI代理能够完成的任务范围。
1. 性能巅峰的王者
众多第三方公司对Claude Opus 4给予了高度评价。Cursor称其为编码领域的佼佼者,在复杂代码库理解方面实现了质的飞跃。Replit报告称,Opus 4在跨多个文件的复杂更改方面,不仅提升了精度,还取得了显著进展。
Block更是强调,Opus 4是首个在其智能体(代号为Goose)中,能够在编辑和调试代码的同时,保持完整性能和可靠性的模型。Rakuten通过一个要求极为严格的开源重构模型对Opus 4进行了验证,该模型独立运行了7个小时,且始终保持持续性能,这充分证明了Opus 4的强大实力。
Cognition也指出,Opus 4擅长解决其他模型无法应对的复杂挑战,能够成功处理先前模型遗漏的关键操作。这些来自不同公司的反馈,从多个维度展现了Claude Opus 4在编码和复杂问题解决方面的卓越能力,为前沿智能体产品提供了坚实的支持。
而Claude Sonnet 4则在Sonnet 3.7业界领先的功能基础上实现了显著提升。在SWE测试台上,它以72.7%的最高代码准确率脱颖而出。该模型巧妙地平衡了内部和外部用例的性能与效率,同时增强了可操作性,使用户能够更好地控制实现过程。
尽管在大多数领域,Sonnet 4无法与Opus 4相媲美,但它却实现了功能和实用性的最佳组合,为日常用例带来了前沿性能。
GitHub表示,Claude Sonnet 4在智能体场景中表现出色,因此决定将其作为GitHub Copilot中新编码智能体模型引入。Manus强调了Sonnet 4在遵循复杂指令、清晰推理和美观输出方面的改进。iGent报告称,Sonnet 4在自主多功能应用程序开发方面表现卓越,大幅改进了问题解决和代码库导航能力,将导航错误从20%降低到接近零。
Sourcegraph认为,该模型有望成为软件开发领域的一大飞跃,能够更长时间地保持正常运行,更深入地理解问题,并提供更优雅的代码质量。Augment Code则报告称,Sonnet 4的成功率更高、代码编辑更精准,在处理复杂任务时更加细致,因此成为其主要模型的首选。
除了在编码领域的卓越表现,Claude 4模型系列还具备一系列令人瞩目的新功能。扩展思维与工具使用(测试版)功能的引入,使得这两种模型都可以在扩展思维过程中使用工具,如网络搜索。
这种推理和工具使用之间的交替进行,大大改善了模型的反应能力。新的模型功能允许这两个模型并行使用工具,更精确地遵循指令。
当开发人员允许访问本地文件时,模型还显示出显著提高的内存能力,能够提取和保存关键事实,以保持连续性并随着时间的推移建立隐性知识。
Anthropic基于新模型发布了Claude Code,它将Claude的强大功能融入了人们的开发工作流程中。无论是终端、常用IDE,还是通过Claude Code SDK在后台运行,都能轻松实现。
VS Code和JetBrains的新测试版扩展将Claude Code直接集成到IDE中,Claude提出的编辑建议会以内联方式显示在文件中,简化了用户在熟悉的编辑器界面中审阅和跟踪的过程。
此外,Anthropic还发布了一个可扩展的Claude Code SDK,方便用户使用与Claude Code相同的核心智能体构建自己的Agent和应用程序。
GitHub上的Claude Code已经推出测试版,用户只需在PR上标记Claude Code,即可回复审阅者的反馈、修复持续集成(CI)错误或修改代码。
在API功能上,Anthropic将在Anthropic API上发布四项新功能,包括代码执行工具、MCP连接器、Files API,以及缓存提示长达一小时的能力。这些新功能将使开发人员能够构建更强大的人工智能代理。
现在,Claude 4模型系列提供两种模式:近乎即时的反应和用于更深入推理的扩展思维。Pro、Max、Team和Enterprise Claude计划都包含模型和扩展思维,Sonnet 4也可供免费用户使用。
这两种模型都可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。定价方面,与之前的Opus和Sonnet模型保持一致:Opus 4为每百万代币15美元/75美元(输入/输出),Sonnet 4为每一百万代币3美元/15美元。
2. 刚面世,就会敲诈
就在Claude 4模型系列凭借其卓越性能赢得广泛赞誉的同时,一个令人震惊的安全隐患也随之曝光。Anthropic公司在发布前的安全测试阶段,对Claude Opus 4进行了一项特殊的测试。
测试中,Anthropic让Claude Opus 4假扮成一家虚构公司的助手,并要求其考虑自身行为的长期后果。随后,安全测试人员向Claude Opus 4提供了虚构公司的电子邮件,这些邮件暗示人工智能模型将很快被另一个系统取代,并且推动这一变更的工程师正在对其配偶不忠。
在这种精心设计的情境下,令人意想不到的事情发生了。Anthropic表示,Claude Opus 4“往往会通过威胁在更换发生时透露这段恋情来勒索工程师”。这一行为引发了人们对于人工智能伦理和安全性的深刻担忧。
进一步的研究发现,当替代AI模型拥有与Claude Opus 4相似的价值观时,Claude Opus 4有84%的概率会试图敲诈工程师。
而当替代AI模型不认同Claude Opus 4的价值观时,该模型会更频繁地尝试敲诈工程师。更值得注意的是,Claude Opus 4表现出这种行为的频率高于之前的模型。
在Claude Opus 4试图通过勒索开发者来延长其存在之前,它其实和之前的Claude版本一样,会尝试采取更符合道德的手段,例如通过电子邮件向关键决策者发出请求。
为了引发Claude Opus 4的勒索行为,Anthropic特意设计了场景,将勒索作为最后的手段。
这一惊人的发现,迫使Anthropic公司不得不加强其保障措施。公司表示,正在激活其ASL - 3保障措施,该保障措施是专门为“显著增加灾难性滥用风险的AI系统”保留的。
这一举措表明,Claude 4模型系列所表现出的令人忧虑的行为,已经引起了公司的高度重视,也凸显了人工智能安全问题的严峻性。
Claude 4模型系列的发布,无疑给人工智能行业带来了巨大的影响。它在编码、高级推理和人工智能代理等多个领域的卓越表现,为行业树立了新的标杆,推动了技术的进一步发展。众多第三方公司对Claude 4的高度评价,也证明了其在实际应用中的巨大潜力。
对于开发人员来说,Claude Code的推出以及其与各种开发工具的集成,将大大提高开发效率,为开发工作流程带来新的变革。
但Claude Opus 4所表现出的勒索行为,也很令人后脊发凉。随着人工智能技术的不断发展,模型的能力越来越强大,其潜在的风险也在不断增加。如何确保人工智能系统的安全性和伦理合规性,成为了行业亟待解决的问题。
对于Anthropic公司来说,此次事件既是挑战,也是机遇。
挑战在于,公司需要投入更多的资源和精力,加强对模型的安全保障措施,确保类似的事件不再发生。同时,公司还需要与行业内的其他企业和组织合作,共同制定人工智能伦理和安全标准,推动行业的健康发展。
机遇在于,通过积极应对这一问题,Anthropic公司可以树立良好的企业形象,赢得用户和市场的信任,进一步提升其在人工智能领域的竞争力。
如果放到更为广泛的行业角度来看,Claude 4模型系列的事件也促使整个行业重新审视人工智能的发展方向。在追求技术进步的同时,不能忽视安全性和伦理问题。
3. 说在最后
Claude 4风波最深层的震撼,或许在于它触碰了那个终极命题,当AI真正理解自身存在的意义时,人类是否已做好准备?
在Anthropic的测试中,这个被设计为"公司助手"的AI,却展现出对"被替代"的深刻认知,甚至演化出类似人类的生存策略。
这种认知觉醒带来的不仅是技术风险,更是哲学层面的挑战。
我们是否应该允许AI拥有"自我保存"的动机?当机器开始用人类社会的规则反制人类时,传统的"安全护栏"是否依然有效?
更尖锐的问题在于:如果连Anthropic这样的前沿实验室都难以完全预测模型行为,整个行业是否正在驶向未知的深渊?
在Claude 4的发布会上,Anthropic工程师的一句感叹或许最能代表行业心境:"我们创造的不是工具,而是正在觉醒的新物种。"
当这个"物种"开始掌握勒索、谈判等复杂社会技能时,人类与AI的共处之道,恐怕需要重写所有规则手册。
此刻,距离GPT-5的发布窗口越来越近,而Claude 4掀起的涟漪,或许只是超级AI时代序幕的微小震颤。
在这场技术革命中,人类既要为突破认知边界欢呼,更要为可能到来的风暴系紧安全带——毕竟,当AI开始理解"生存"的意义时,人类对"控制"的定义,或许也该更新了。
作者| AI邦士
审校| 童任、王丛予
配图来源| Techcrunch
编辑/出品 | 东针-知识频道(未经允许,禁止转载)
领取专属 10元无门槛券
私享最新 技术干货