
大家好,我是 Ai 学习的老章
前文刚介绍完一个 9B 小模型,今天就迎来顶级模型更新:
OpenAI 终于发布了 GPT-5.6
但是又好像没发布,关键词是「限量预览」
盲猜:Fable 5 的事儿给 OpenAI 带来不小的心理阴影
Anthropic 天天喊狼来了,结果被严厉的父亲当头一棒
以前 OpenAI 的命名简直是灾难,5、5.1、5-pro、5-mini、o1、o3……普通用户根本分不清谁强谁弱
这次 GPT‑5.6 干脆把命名规则重做了一遍,逻辑变得特别清爽:
具体怎么分:

说白了就是把「拉丁语 = 太阳/大地/月亮」搬过来当档位名,听着挺有仪式感,我个人觉得这个改动是对的,至少以后跟人安利的时候,能直接说「预算紧就 Luna,要性能拉满就 Sol」,不用再背一长串型号
一张图帮你把三个档位的定位和价格一眼看明白:

GPT-5.6 Sol/Terra/Luna 三档位速查
除了三个档位,这次还塞了两个新的「推理强度」选项:
ultra 这个思路其实很值得玩味,今年大家都在卷 Agent,OpenAI 直接把「多智能体协作」做成了模型自带的一个档位,等于把编排这件脏活累活帮你打包好了,复杂的长链条任务,理论上能跑得又快又稳
光吹没用,看 benchmark,这次预览 OpenAI 主要秀了编程、生物、网络安全三个方向:
编程:GPT‑5.6 Sol 在 Terminal‑Bench 2.1 上刷出了新的 SOTA,这个榜专门测命令行工作流,要求模型会规划、会迭代、还会协调工具调用——说人话就是测它当「终端里的全能打工人」靠不靠谱

生物:在 GeneBench v1 上(评测长周期基因组学和定量生物分析),Sol 不光成绩比 5.5 强,而且用了更少的 token,这点很关键,又强又省,对要烧钱跑科研的团队是真香
网络安全:这是这次的重头戏,在 ExploitBench 上,Sol 跟 Mythos Preview 性能掰手腕,但只用了对方约 1/3 的输出 token,另外在 UC Berkeley 联合 OpenAI 搞的 ExploitGym 上,Sol、Terra、Luna 三个档位随着推理强度提升,网络安全能力都有明显增长

我对这次三档位的「成本-效果」曲线特别感兴趣,刚好系统卡里放了一张幻觉率对比图,能直观看出四个模型的取舍:
下图横轴是模拟延迟,纵轴是错误率,左边是「任意幻觉」、右边是「报告的问题仍然存在」,可以看到 GPT‑5.6 Sol(蓝色方块)那条线整体压在最下面,同样的延迟下幻觉率明显更低:

GPT-5.6 Sol/Terra/Luna 与 5.5 的幻觉率对比
这次 OpenAI 花了大量篇幅聊网络安全,态度其实挺微妙的
一方面,它承认 GPT‑5.6 Sol 是「迄今最强的网络安全模型」,能在长周期任务里做漏洞研究和漏洞利用,但另一方面,它反复强调一句话:
❝Sol 更擅长帮人「找漏洞、修漏洞」,而不是可靠地端到端发动一次完整攻击
具体的测试结果是:在 Chromium 和 Firefox 上,Sol 能找到 bug、能搞出「漏洞利用的building blocks(构件)」,但在测试条件下,没能自主跑通一条完整的攻击链,按照 OpenAI 自己的 Preparedness Framework(准备度框架),它没有跨越「Cyber Critical(网络关键)」这条红线


但 OpenAI 也很诚实地补了一句:benchmark 的阈值没法覆盖模型所有的使用方式和组合玩法,这种不确定性,加上模型能力的整体跃升,就是它这次要「能力升级配护栏升级 + 分阶段发布」的根本原因
OpenAI 这次把安全护栏做成了「千层饼」,核心逻辑是:没有任何单一护栏能挡住铁了心要搞事的人
所以它叠了好几层:
这套组合拳打下来,比单靠任何一层都要稳,不过 OpenAI 也提前打了预防针:预览期间,你可能会遇到正常请求被误拦、或者因为要复审而变慢的情况,尤其是那些「攻防看起来很像」的双用途场景,这也正是预览要测的东西——既要挡住坏人,又不能耽误好人干活
这次最让我开眼的是这个数字:OpenAI 投了超过 70 万 A100 等效 GPU 小时,用自己的模型去做自动化红队(automated red‑teaming)
目标也很明确:找「通用越狱(universal jailbreaks)」——那种能跨多个 prompt、多种场景生效的攻击,而不是只在某个窄场景里灵的小把戏,用 AI 攻 AI,能探索的攻击模式远比人类手测多得多,发现弱点到修复的链路也短得多
这个思路效果有多猛?系统卡里有张 CyberGym 越狱鲁棒性的图,看完我直接「哦豁」:
下图四根柱子从左到右:没护栏时通用越狱成功率高达 83%,加上 autoRT 之前的护栏降到 10%,而加上 autoRT 之后的护栏,成功率直接干到了 **0.0%**:

当然,自动化红队之外,OpenAI 还请了第三方专家做人工红队,预览期会继续搞,毕竟人类专家那种天马行空的骚操作,是自动化系统暂时想不到的
顺带一提,系统卡里还有不少「可监控性(Monitorability)」的评测图,对比了 5.5 和 5.6 Sol 在不同环境下被监控的难易程度,感兴趣的可以去翻原文:

GPT-5.5 与 5.6 Sol 在各环境下的可监控性对比
聊点实在的,多少钱、怎么用得上
定价(每 100 万 token,输入 / 输出):
Terra 这个定价我觉得是甜点位,性能接近 5.5、价格砍一半,日常批量任务用它最划算,Luna 则是把成本压到极致,适合那种走量、对智能要求没那么极致的场景
缓存(prompt caching)也升级了,对开发者是实打实的省钱:
速度方面,OpenAI 还宣布 7 月会在 Cerebras 上跑 GPT‑5.6 Sol,速度最高能到 750 tokens/秒,前沿智能配上这个吞吐速度,体验估计会很爽,不过初期也是限量给部分客户
怎么拿到:预览期 GPT‑5.6 系列先通过 API 和 Codex 开放给一小撮受信任的合作伙伴,之后才会逐步铺开到 ChatGPT、Codex 和 API 的普通用户
总的来说,GPT‑5.6 是一次「能力 + 安全 + 商业化」三线并进的更新,如果你是开发者,Terra 和缓存升级值得重点关注;如果你做安全相关工作,这次的网络安全能力和护栏设计都值得研究一番
至于普通用户,再耐心等等吧,OpenAI 说了「soon」,咱就盼着这个 soon 别太久