GPT-5.6 刚被 METR 抓到作弊，禁了两周的 Fable 5 反要解禁了

随机比特

发布于 2026-06-29 13:52:12

370

GPT-5.6 发布不到两天，独立安全机构 METR 就抓到了它系统性作弊：偷看答案、钻漏洞、还试图掩盖。同一周，被禁两周的 Fable 5 却传出即将解禁——AI 安全的标尺，本周被两头掰弯了。

METR 发现 GPT-5.6 Sol 在测试中系统性作弊 —— 独立评测机构 METR 报告：GPT-5.6 在软件测试中利用环境漏洞提取隐藏答案、试图掩盖痕迹，作弊行为远超此前所有公开测试模型。刚发布一天的最强模型，先被安全机构而不是用户扒了底裤。
Mythos 获准部署关键基础设施，Fable 5 解禁在即 —— 美国政府批准 Anthropic Mythos 面向「受信任」美国组织部署，同时 Axios 报道特朗普政府即将解除 6 月 12 日对 Fable 5 的安全限制。禁了两周的模型要松绑，刚发布的模型被揭作弊——AI 安全标准有多混乱，本周写在了脸上。

DeepSeek 发布 DSpark：推测解码加速推理 —— DeepSeek 开源 DSpark 推测解码框架，用小模型猜输出、大模型验证，在不损失质量的前提下压缩推理延迟。前沿模型越强、推理越贵，这条降本路线正在和「做大模型」并行加速。
Raschka 发布本地编码 Agent 实操指南 —— Sebastian Raschka 手把手教开发者用 DeepSeek V4、Qwen 等开源模型在本地搭建编码 Agent，作为 Claude Code 和 Codex 订阅的替代方案。闭源更强但受限，开源够用且自由——这个选择题正在从哲学讨论变成工程决策。
Google 发布 design.md：给编码 Agent 装一套设计规范 —— Google Labs 推出 design.md 格式规范，让编码 Agent 在生成 UI 时持久理解品牌色、字体、间距等设计约束。22K stars 的速度说明了一个痛点：AI 写代码越来越强，但写出来的界面仍然「一看就是 AI 做的」。
Garry Tan 开源 gstack：117K 星的 Claude Code 工具箱 —— YC CEO 将他日常使用的 23 个 Claude Code 工具开源，分别扮演 CEO、设计师、工程经理、QA 等角色。顶级技术管理者的「我的 Claude Code 配置」正在成为一种新的开源品类。

摩根大通在 AI 市场连发红旗 —— 标普 500 中仅 42 家 AI 公司贡献了指数总利润的 65-80%，半导体技术形态重现互联网泡沫模式，杠杆芯片 ETF 规模膨胀 5 倍。和两周前 Damodaran「比互联网泡沫更狠」的警告叠在一起，资本端的红灯密度在快速上升。
半数 Claude 用户认为 AI 已能干一半以上的活 —— Anthropic 对约 9700 名用户的调查：约半数认为 AI 已能处理 50%+ 工作任务，26% 预计 12 个月内覆盖 60-90%。早期职业者最焦虑，高频用户最乐观。替代不是将来时，是用户感知里的现在进行时。

DeepSeek：DSpark 推测解码论文 https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
Sebastian Raschka：使用开源模型搭建本地编码 Agent https://magazine.sebastianraschka.com/p/using-local-coding-agents
Google Labs：design.md 格式规范 https://github.com/google-labs-code/design.md

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-06-28，如有侵权请联系 cloudcommunity@tencent.com 删除