GPT-5.6来了，强到没边，但普通人还摸不到

Ai学习的老章

发布于 2026-06-29 13:35:55

110

文章被收录于专栏：机器学习与统计学机器学习与统计学

大家好，我是 Ai 学习的老章

前文刚介绍完一个 9B 小模型，今天就迎来顶级模型更新：

OpenAI 终于发布了 GPT-5.6

但是又好像没发布，关键词是「限量预览」

盲猜：Fable 5 的事儿给 OpenAI 带来不小的心理阴影

Anthropic 天天喊狼来了，结果被严厉的父亲当头一棒

先搞懂：Sol、Terra、Luna 是啥

以前 OpenAI 的命名简直是灾难，5、5.1、5-pro、5-mini、o1、o3……普通用户根本分不清谁强谁弱

这次 GPT‑5.6 干脆把命名规则重做了一遍，逻辑变得特别清爽：

数字（5.6）：代表这一代的「代际」，类似 iPhone 的 16、17
Sol / Terra / Luna：代表三个「能力档位」，而且这三个名字会长期存在，各自按自己的节奏进化

具体怎么分：

Sol：旗舰中的旗舰，OpenAI 说这是「迄今为止最强的模型」，要榨干智能上限就用它
Terra：均衡款，日常干活主力，性能跟上一代 GPT‑5.5 打得有来有回，但价格便宜了一半
Luna：快又便宜款，用最低的成本提供还不错的能力

说白了就是把「拉丁语 = 太阳/大地/月亮」搬过来当档位名，听着挺有仪式感，我个人觉得这个改动是对的，至少以后跟人安利的时候，能直接说「预算紧就 Luna，要性能拉满就 Sol」，不用再背一长串型号

一张图帮你把三个档位的定位和价格一眼看明白：

GPT-5.6 Sol/Terra/Luna 三档位速查

两个新玩法：max 和 ultra

除了三个档位，这次还塞了两个新的「推理强度」选项：

max 推理强度：给 Sol 留出最长的时间去「深度思考」，遇到硬核难题，让它慢慢磨
ultra 模式：这个就狠了，它不再是单个 agent 单打独斗，而是调度一群子 agent（subagents）协同，去加速复杂任务

ultra 这个思路其实很值得玩味，今年大家都在卷 Agent，OpenAI 直接把「多智能体协作」做成了模型自带的一个档位，等于把编排这件脏活累活帮你打包好了，复杂的长链条任务，理论上能跑得又快又稳

实力到底强在哪

光吹没用，看 benchmark，这次预览 OpenAI 主要秀了编程、生物、网络安全三个方向：

编程：GPT‑5.6 Sol 在 Terminal‑Bench 2.1 上刷出了新的 SOTA，这个榜专门测命令行工作流，要求模型会规划、会迭代、还会协调工具调用——说人话就是测它当「终端里的全能打工人」靠不靠谱

生物：在 GeneBench v1 上（评测长周期基因组学和定量生物分析），Sol 不光成绩比 5.5 强，而且用了更少的 token，这点很关键，又强又省，对要烧钱跑科研的团队是真香

网络安全：这是这次的重头戏，在 ExploitBench 上，Sol 跟 Mythos Preview 性能掰手腕，但只用了对方约 1/3 的输出 token，另外在 UC Berkeley 联合 OpenAI 搞的 ExploitGym 上，Sol、Terra、Luna 三个档位随着推理强度提升，网络安全能力都有明显增长

我对这次三档位的「成本-效果」曲线特别感兴趣，刚好系统卡里放了一张幻觉率对比图，能直观看出四个模型的取舍：

下图横轴是模拟延迟，纵轴是错误率，左边是「任意幻觉」、右边是「报告的问题仍然存在」，可以看到 GPT‑5.6 Sol（蓝色方块）那条线整体压在最下面，同样的延迟下幻觉率明显更低：

GPT-5.6 Sol/Terra/Luna 与 5.5 的幻觉率对比

网络安全：一把双刃剑

这次 OpenAI 花了大量篇幅聊网络安全，态度其实挺微妙的

一方面，它承认 GPT‑5.6 Sol 是「迄今最强的网络安全模型」，能在长周期任务里做漏洞研究和漏洞利用，但另一方面，它反复强调一句话：

❝Sol 更擅长帮人「找漏洞、修漏洞」，而不是可靠地端到端发动一次完整攻击

具体的测试结果是：在 Chromium 和 Firefox 上，Sol 能找到 bug、能搞出「漏洞利用的building blocks（构件）」，但在测试条件下，没能自主跑通一条完整的攻击链，按照 OpenAI 自己的 Preparedness Framework（准备度框架），它没有跨越「Cyber Critical（网络关键）」这条红线

但 OpenAI 也很诚实地补了一句：benchmark 的阈值没法覆盖模型所有的使用方式和组合玩法，这种不确定性，加上模型能力的整体跃升，就是它这次要「能力升级配护栏升级 + 分阶段发布」的根本原因

一套分层的安全护栏

OpenAI 这次把安全护栏做成了「千层饼」，核心逻辑是：没有任何单一护栏能挡住铁了心要搞事的人

所以它叠了好几层：

模型层：训练时就让模型学会拒绝违规的网络攻击请求，哪怕你伪装意图、想越狱也不行
实时层：生成过程中，网络安全和生物两个实时分类器盯着输出，一旦发现可能违规，就暂停生成，让一个更大的推理模型回头审一遍上下文，判定违规就直接拦下不给你
账号层：可疑行为会触发跨对话的账号级审查，用来区分「持续的恶意行为」和「正常的双用途安全研究」
差异化访问：最敏感的能力默认不向所有人开放

这套组合拳打下来，比单靠任何一层都要稳，不过 OpenAI 也提前打了预防针：预览期间，你可能会遇到正常请求被误拦、或者因为要复审而变慢的情况，尤其是那些「攻防看起来很像」的双用途场景，这也正是预览要测的东西——既要挡住坏人，又不能耽误好人干活