Anthropic刚刚发布了Claude Sonnet 4.5
我深扒了一圈发现,事情没那么简单…
Every.to 的 Dan Shipper 对 Anthropic 最新推出的 Claude Sonnet 4.5 进行了速度、性能和日常使用的全面评估,并与 GPT-5 Codex 和 Opus 4.1 进行了比较
https://every.to/vibe-check/vibe-check-claude-sonnet-4-5
真相一:30小时连续编程?听起来很牛但…
Anthropic刚刚发布了Claude Sonnet 4.5,号称”全球最强编程模型“但我深扒了一圈发现,事情没那么简单…
官方说这个AI能连续自主编程30小时,不仅能写代码,还能自己搭建数据库、买域名、做安全审计
BUT!有专业测评指出:基准测试的高分不代表实际部署就能成功 。简单说就是——考试考得好≠实战能打
就像你高考数学满分,不代表能算清楚双11满减
真相二:价格便宜?其实是个”陷阱”
Claude Sonnet 4.5每百万输入tokens要3美元、输出15美元,看起来比自家Opus便宜(15/75美元)
可是!GPT-5和GPT-5-Codex只要1.25/10美元 ,便宜不止一点点!
所以”性价比高”得看跟谁比
真相三:“全球最强”?开发者们不完全买账
虽然官方宣传很猛,但实际体验很微妙:
有团队测试发现,Claude Sonnet 4.5做代码审查确实快(2分钟),GPT-5 Codex要10分钟。但在复杂的生产bug排查上,GPT-5 Codex能抓到Sonnet漏掉的边缘问题
用开发者的话说:
Claude像个“编程20年的聪明人”
GPT-5 Codex更像“脾气暴躁的高级工程师”
真相四:速度快≠智商高
测评团队发现Claude Sonnet 4.5确实更快、更精准、更稳定 ,但这主要是因为:
指令执行更听话
不容易在大代码库里迷路
回答更简洁不啰嗦
听话的好学生 vs 有想法的天才,你选哪个?
到底该选谁?我的建议是:
日常编程、快速迭代 Claude Sonnet 4.5(快!稳!听话!)
复杂架构、刁钻Bug GPT-5 Codex(经验老到)
长时间智能体任务 Claude(耐力好)
预算有限 GPT-5系列(真香)
最后说两句
AI模型这个圈子卷得太快了!Claude Sonnet 4.5刚发两个月前才发布Claude Opus 4.1,现在又来新模型
说实话,没有永远的”最强”,只有更适合你的
而且这些模型进步这么快,说不定下周就被Gemini 3超了呢(据说快发布了)
我是赛脖古,感谢点赞关注!
*部分题图来自互联网,侵删
end