首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

惊爆!因担忧对手 “蒸馏”,OpenAI 亮出 “阉割版” 思维链,惹网友失望透顶,员工尴尬回应:推理乱但结果没错!

OpenAI又有新动态了!

奥特曼预告的o3 “one-more-thing”来了!

OpenAI突然对免费和付费用户的o3-mini思维链进行了更新。此次更新后,我们终于能够查看模型的推理步骤以及它得出答案的过程了!

同时,据OpenAI介绍,选择“高推理”模式并使用o3-mini的高级ChatGPT订阅用户,也将能看到这一改进后的推理展示。

OpenAI在推文中给出了一个例子,用户问ChatGPT“今天为啥不是周五呢?”o3思考了一下,甚至还用了个的emoji回应,“我也很惊讶今天不是周五,我猜,当你准备好过周末时时间的流速就变慢了吧”。

OpenAI发言人在接受采访时表示:“我们正在为o3-mini引入更新后的[思维链],让用户更容易理解模型的思考方式。通过这次更新,用户可以更清晰地跟随模型的推理过程,从而对其回答更有信心。”

看到OpenAI的新动向,评论区纷纷惊呼:DeepSeek效应无敌了,让我们一起说谢谢!

但是……也不能高兴得太早!网友很快就发现了其中的问题——现在o3-mini展示的思维链居然是“阉割版”。

OpenAI评论区的第一热评就是:你给的这是原始思维链吗?

一位网友回复道,自己几乎可以肯定不是,它只是被小模型复述的摘要版CoT。

连奥特曼都直接承认了,现在的CoT是经过“整理”的,更好读(手动狗头),并且还会针对用户语言进行翻译。

许多网友对此大失所望。o3-mini的“one-more-thing”就是这?还不如DeepSeek能免费看完整推理。

而且,再做一次摘要其实很容易出bug。

例如有网友,就看到了疑似o3-mini原始思维链以及摘要代码……真的很尴尬!

所以,为啥OpenAI不能大大方方地展示完整思维链呢?

OpenAI为啥不公开原始思维链?

真相只有一个:怕被蒸馏。

在上周的Reddit AMA(在线问答)中,OpenAI首席产品官Kevin Weil透露说:

“我们正在努力展示比现在更多的内容——[展示模型的思维过程]很快就会实现。具体方案尚未确定——完整展示思维链可能会导致竞争对手进行知识蒸馏(competitive distillation),但我们也知道用户(至少是高阶用户)希望看到完整的推理过程,所以我们会找到合适的平衡点。”

因此,“抠抠搜搜”的OpenAI找到了一个折中的方案:o3-mini先进行推理,然后将思维整理成摘要。

OpenAI发言人在接受采访时补充了思维链的“整理”细节:“为了提升清晰度和安全性,我们新增了一个后处理步骤,模型会复查原始思维链,移除任何不安全内容,并简化复杂的概念。此外,该后处理步骤还能让非英语用户以其母语获取思维链,使体验更加友好和易于理解。”

当然,OpenAI的担心不无道理。优质的思维链数据构造出的数据集,会让复刻模型推理能力变得简单且成本低廉。昨天,我们刚刚报道过李飞飞团队,利用1000个问题及其答案,记录了Gemini 2.0 Flash Thinking Experimental的“思考过程”数据,以此构建的训练集对开源小模型进行微调,性能可媲美o1mini。

问题是,OpenAI很难找到防止蒸馏与保障用户体验的“平衡点”,反而会闹出乌龙。

讽刺的是,此前o3-mini被发现使用中文做推理,被网友怀疑o3是不是蒸馏过DeepSeek,或使用了部分代码/数据。

o3思维链一手实测:错误的摘要可能比“黑箱”更糟糕

OpenAI的员工Noam Brown发推,用井字棋问题测试o3-mini。

他称赞说,“o3-mini是首个稳定答对这个井字棋问题的大型语言模型(LLM)。”但也直言了o3-mini的大缺陷:“总结后的思维链(CoT)看起来有些混乱,但你可以看到,在右侧的最终推理过程中,模型还是找到了正确答案。”

问题是,用户本来就依赖推理过程来判断结果是否值得信任。

在混乱的推理过程后,用户该如何理解模型得出的“正确答案”呢?就像一位网友所说的:我担心总结后的思维链实际上比什么都没有更加糟糕。

另外,小编好奇o3-mini是不是真的是首个能稳定回答井字棋问题的模型。于是用Noam Brown的prompt丢给了DeepSeek。

因为模型思考这个问题会遍历所有的可能,再加上模型自己会做检查,一度我看着AI不断地输出推理,怀疑它是否已经陷入了循环。大家也可以从右侧滑块感受这篇推理到底有多长。

最终,DeepSeek拿下了正确答案,而且,它全部的推理过程都是可查的!

而如此篇幅的推理过程,很难被形成一个正确的摘要。这就是o3出现混乱的原因。

写在最后:前CTO的创业公司或成为OpenAI新对手

OpenAI试图获取的平衡,正暴露了这家公司陷入了一个两难的困境中。

值得注意的是,在Anthropic之后,又一家OpenAI“原版人马”的创业公司要和其打擂台了。

那就是OpenAI前CTO Mira Murati低调创立的新创业公司!

据《财富》报道,OpenAI联合创始人John Schulman本周早些时候从AI公司Anthropic离职,将跳槽到Mira的新公司。值得注意的是,John Schulman才刚刚加入Anthropic五个月。

自去年9月离开OpenAI以来,Mira对新公司的情况守口如瓶。不过,据知情人士透露,Murati已招募了多名前OpenAI员工,其中包括曾在OpenAI超算团队工作的Christian Gibson。

所以,OpenAI的人才动荡估计又要持续一阵了。

END

  • 发表于:
  • 原文链接https://page.om.qq.com/page/O3uq5wMZtO5jzu4LaMcEMc1g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券