GPT-5终于发布了，但远低于预期

文章来源：企鹅号 - 甲木未来派

本来针对GPT-5觉得没啥特别想写的，但毕竟“狼来了”的故事两年多了，现在真来了，还是简单说几句吧。体验了一上午，先来一句话总结，纯个人观点「场景推理/上下文能力增强，编程能力有效提升，但文本方面感觉反而不如4.5，总体不及预期」1、GPT-5，大一统模型，把之前的4o,o3,o3-mini等等非推理和推理模型打包在一起，由实时路由器决定用哪个，对于大部分普通用户来说，不用纠结于选择哪个模型了..2、已经向所有用户开放，打开首页就能看到，GPT-5已是ChatGPT默认；Free能用、Plus更高额度、Pro不限量且能上Pro版思考。3、一个不错的提升，GPT-5把“幻觉率”压下去了，开放域事实类问题的幻觉显著下降，且更愿意承认“不知道”。同时在回答风格也收敛了：少奉承、少emoji、少空话，多直接、多解释清楚做不到的原因。4、跑分和各种榜单就不多聊了，结果就是全面屠榜，分数都是第一。但具体效果，还需要使用使用亲身感受一下才知道。5、当下一些场景的指令遵循度一般，可能我还没太玩转这种「大一统」模型，在Prompt层面需要加点料，要不总会router到小模型，效果不佳。6、编程是最大赢家，前端生成效果更美、更一致，长仓库定位与修复更准，主流基准SOTAs基本到位，而在服务端应用上，定位问题，上下文精准把控层面做的很到位，还在慢慢测，另外API价格也降下来了，更佳亲民一点。7、文章写作，文本层面自己测试感觉不及预期，文字优美度不如4.1和4.5，还在慢慢摸索它的方式…8、多模态能力的提升体感也不太明显9、人设回复逻辑上，OpenAI还推出了四种新的人格预设，你可以在“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”之间切换，省得自己费劲写提示词了。10、这次GPT5发布，在X上热度并不高，但是反观国内，某些媒体的爆炸标题党，什么「王者降临」「登月时刻」，还有早期的「xx被吓得眩晕瘫坐」，真是离谱到家了，好歹那么大体量的媒体，真就瞎XX吹。GPT-5把“模型选择”这道用户题收走了，同时也把我们对于AI能力代际提升的期望收走了。但当下AI其实已经足够解决现实问题了，拼落地，拼应用场景。技术，最终还是要落到为「人」服务上。

发表于: 2025-08-082025-08-08 12:30:44
原文链接：https://page.om.qq.com/page/OlyMt4x7XqsoF1ERcxVnkH9w0
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

GPT-5终于发布了，但远低于预期

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐