OpenAI发布“深度研究”:一款能够撰写详细报告的AI代理。但目前仅对欧洲以外的Pro用户开放。
OpenAI深度研究主要功能
深度研究通过升级的网络搜索能力编译高度技术性的报告。
目前仅通过ChatGPT界面提供,尚未提供API。
从今天开始,欧洲以外的Pro用户可以有限访问,Plus和Teams用户将紧随其后。
产品介绍
在推出新的推理模型仅三天后,OpenAI又发布了一款新产品:一款能够自主浏览网络并编译详细报告的AI代理。
深度研究解决了AI模型在生成技术主题的全面报告方面的长期局限性。OpenAI表示,其新代理能够在网络上搜索小众细节,并根据找到的数据调整搜索策略。
该公司声称,生成的报告可以与专业研究分析师的报告相媲美,但只需几分钟而非数小时。
该产品专为科学、医学和其他技术用例设计,但早期用户已用它生成了从托尔斯泰的《战争与和平》的论文长度报告到上市公司文件中的财务违规清单等各种内容。
对于独立开发者来说,这可能是一个用于详细市场研究和商业规划的有用工具。如果未来通过API提供(目前尚未有相关消息),开发者可以用它生成各种小众主题的专家级报告——这可能是潜在的 lucrative AI 包装机会。
深度研究的工作原理
AI模型通常在撰写经过充分研究的长篇回答时表现不佳,例如详细的市场报告或学术文献综述。部分问题在于它们通常仅基于用户提供的查询进行一次网络搜索。
与标准的联网LLM不同,深度研究使用“思维链”过程来生成更好的报告。它还会在开始时提出澄清问题,以明确用户希望它找到的内容。然后,它在撰写回答的过程中反复搜索网络,根据找到的数据调整结构和内容。
它本质上是即将推出的o3“推理”模型的升级版,具备反复搜索网络的能力和一些Python分析技能。
生成报告需要一些时间——实际上可能需要长达30分钟。但OpenAI表示,人类需要数小时才能完成类似的工作。
如何使用深度研究
拥有访问权限的用户将在ChatGPT的常规提示输入框下方看到一个“深度研究”按钮。选择此框后,代理将接收用户的提示。
最初,代理会提出澄清问题以改进提示,并确保它确切知道用户希望它撰写的内容。
OpenAI深度研究界面
然后,代理将开始在互联网上搜索可以阅读和分析的文本、图像和PDF。
根据查询的不同,结果可能需要1到30分钟才能出现。但感兴趣的用户可以通过打开侧边栏查看进度更新,如上图所示。
OpenAI声称,深度研究在多个学术基准测试中提供了最先进的结果。但它仍然容易出现错误,因此在将报告用于业务之前,您应仔细检查其引用的任何事实。
该公司表示,深度研究比旧解决方案更不容易出错。但它仍然会产生幻觉,并且难以区分事实与谣言。它也无法真正传达不确定性,因此即使在不应该自信的情况下,它也可能听起来很自信。
它的报告可能会为您提供新市场的有用窗口,但不能将其视为事实。这可能会影响其作为报告撰写业务引擎的实用性,如果未来提供API的话。
谁可以访问深度研究?
深度研究已经向Pro订阅用户推出,预计Plus和Teams用户将在大约一个月后获得访问权限。
也就是说,除非他们住在欧洲。与OpenAI的第一个代理Operator一样,目前尚不清楚深度研究何时会在欧盟、英国和欧洲经济区提供。
这种区域范围的限制可能是由于欧盟最近的《AI法案》中的限制。OpenAI表示,希望最终将这些产品引入该地区,但没有给出时间表。