首页
学习
活动
专区
圈层
工具
发布

GPT-5终于发布了,但远低于预期

本来针对GPT-5觉得没啥特别想写的,但毕竟“狼来了”的故事两年多了,现在真来了,还是简单说几句吧。体验了一上午,先来一句话总结,纯个人观点「场景推理/上下文能力增强,编程能力有效提升,但文本方面感觉反而不如4.5,总体不及预期」1、GPT-5,大一统模型,把之前的4o,o3,o3-mini等等非推理和推理模型打包在一起,由实时路由器决定用哪个,对于大部分普通用户来说,不用纠结于选择哪个模型了..2、已经向所有用户开放,打开首页就能看到,GPT-5已是ChatGPT默认;Free能用、Plus更高额度、Pro不限量且能上Pro版思考。3、一个不错的提升,GPT-5把“幻觉率”压下去了,开放域事实类问题的幻觉显著下降,且更愿意承认“不知道”。同时在回答风格也收敛了:少奉承、少emoji、少空话,多直接、多解释清楚做不到的原因。4、跑分和各种榜单就不多聊了,结果就是全面屠榜,分数都是第一。但具体效果,还需要使用使用亲身感受一下才知道。5、当下一些场景的指令遵循度一般,可能我还没太玩转这种「大一统」模型,在Prompt层面需要加点料,要不总会router到小模型,效果不佳。6、编程是最大赢家,前端生成效果更美、更一致,长仓库定位与修复更准,主流基准SOTAs基本到位,而在服务端应用上,定位问题,上下文精准把控层面做的很到位,还在慢慢测,另外API价格也降下来了,更佳亲民一点。7、文章写作,文本层面自己测试感觉不及预期,文字优美度不如4.1和4.5,还在慢慢摸索它的方式…8、多模态能力的提升体感也不太明显9、人设回复逻辑上,OpenAI还推出了四种新的人格预设,你可以在“愤世嫉俗者”、“机器人”、“倾听者”和“书呆子”之间切换,省得自己费劲写提示词了。10、这次GPT5发布,在X上热度并不高,但是反观国内,某些媒体的爆炸标题党,什么「王者降临」「登月时刻」,还有早期的「xx被吓得眩晕瘫坐」,真是离谱到家了,好歹那么大体量的媒体,真就瞎XX吹。GPT-5把“模型选择”这道用户题收走了,同时也把我们对于AI能力代际提升的期望收走了。但当下AI其实已经足够解决现实问题了,拼落地,拼应用场景。技术,最终还是要落到为「人」服务上。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OlyMt4x7XqsoF1ERcxVnkH9w0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券