首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >GPT-5.5 Instant上线:幻觉减少52.5%,告别废话

GPT-5.5 Instant上线:幻觉减少52.5%,告别废话

作者头像
用户11563501
发布2026-06-23 14:05:14
发布2026-06-23 14:05:14
1020
举报
ChatGPT界面截图
ChatGPT界面截图

OpenAI今日完成ChatGPT默认模型的静默升级,GPT-5.5 Instant全面替换GPT-5.3 Instant。这个被数亿用户当作「日常档」的模型,改进都落在实际痛点上。

数学推理能力提升

官网展示了一个关键对比:当用户求解代数方程时,GPT-5.3 Instant在发现初始解不成立后直接放弃,而GPT-5.5 Instant能回溯检查代数错误,重新推导出正确解。这种自我纠错能力在日常使用中很实用。

代数题对比
代数题对比

幻觉减少52.5%

内部测试显示,在医疗、法律等高危领域,编造事实的概率降低过半。用户标记过的错误回答减少37.3%。学术基准同步提升:GPQA博士级科学题准确率从78.5%升至85.6%,AIME数学竞赛成绩跳涨15.8个百分点。

告别废话

有网友测试发现,问「如何煮鸡蛋」这类简单问题,新版回答长度平均缩短42%。过度排版、冗余反问和表情符号明显收敛。

在职场沟通建议的对比中,GPT-5.5 Instant用词量减少30.2%,行数减少29.2%,直接给出实用脚本而非长篇大论。

记忆变成实用功能

当用户询问「推荐新茶饮店」时,模型会主动调用Gmail预订记录、过往聊天提到的口味偏好。新增的「记忆来源」功能让每条个性化回答都可追溯数据源,支持随时删除引用内容。

灰度推送策略

  • 免费用户即刻可用新模型,API别名为chat-latest
  • 付费用户可手动切回GPT-5.3 Instant,保留期三个月
  • 个性化记忆功能率先开放给Plus/Pro网页端用户

有开发者指出,这次升级最聪明的设计是保持「Instant」的定位——不追求全面超越GPT-5.5 Thinking,而是在日常场景做到「够用且顺手」。当多数人甚至意识不到模型切换时,或许才是真正的体验胜利。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-05-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI工程化 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数学推理能力提升
  • 幻觉减少52.5%
  • 告别废话
  • 记忆变成实用功能
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档