OpenAI分段发布人工智能，一场如何处理高风险研究的实验

文章来源：企鹅号 - 寒非先生

OpenAI人工智能实验室发布了一份报告，解释为什么要逐步发布该模型。

通用人工智能可能做的事

今年2月，OpenAI突然进入了公众视野，因为它创造了一种非常擅长生成假新闻的语言模型，但该组织决定不发布它。人工智能研究领域的一些人认为，这是明智的预防措施；其他人则认为这是一种宣传噱头。OpenAI本身是一家总部位于旧金山的非营利人工智能研究组织，致力于创造通用人工智能。OpenAI坚定地认为，这是一项如何处理高风险研究的重要实验。

现在六个月过去了，政策小组发表了一篇论文，研究迄今为止该决定的影响。与此同时，实验室还发布了一个称为GPT-2版本的模型，相当于尚未发布的完整版本的一半大小。

今年5月，在GPT-2初始版本首次亮相的几个月后，OpenAI改变了其要保留完整代码的立场，将其称为“分阶段发布”，即对该模型分逐步增量发布，直到最终发布完整版本。今年2月，该公司发布了该模型的第一个版本，相当于整个模型的8%。在最新版本发布之前，它又发布了大约四分之一的完整版本。在这个过程中，它还与选定的研究机构合作，研究整个模型的影响。

报告详细描述了OpenAI在逐步发布过程中所了解到的内容。它指出，分阶段发布和研究合作协议都被证明是值得在未来进行复制的过程。这两者帮助OpenAI更好地理解和预测GPT-2可能的恶意用途。事实上，研究伙伴能够更好地量化一些以前只是推测的威胁。例如，康奈尔大学的合作者进行的一项研究发现，读者平均认为GPT-2的输出内容是真实新闻文章的概率，几乎与《纽约时报》的文章一样多。一些官方合作关系之外的研究人员也开始着手解决检测机器生成文本的问题。

OpenAI经过仔细的监控还没有发现任何恶意使用的企图，但看到了多种有益的应用程序，包括代码自动完成、语法帮助和开发用于医疗援助的问答系统。因此，实验室认为发布最新的代码最终会更有益。其他研究人员认为，复制GPT-2的几次成功尝试使得OpenAI对代码的保留毫无意义。

这份报告收到的回应褒贬不一。一些人称赞OpenAI引发了一场讨论，并引入了一套以前不存在的新规范。分阶段发行GPT-2的实验很有用，通过召集人工智能社区讨论这些问题，研究发现在决定何时以及如何发表有可能产生意外后果或被恶意使用的研究时，需要正确对待很多微妙的地方。”

然而，有人仍然对OpenAI的决定持批评态度。毕业于布朗大学的Vanya Cohen重新创建了一个GPT-2的开源版本，她认为，发布完整版比分步骤发布更能加快对策研究的速度，像GPT-2这样的大型语言模型是目前用来识别由这些模型生成的伪文本最好的工具。

还有一些人则比较谨慎:英伟达的深度学习工程师奇普•休延表示:“分阶段发布可能会有用，因为它为未来的项目树立了一个先例。人们将把分阶段发布看作是另一种选择”。艾伦人工智能研究所的CEO奥伦·埃齐奥尼对此观点也表示认可:“我赞赏他们为人工智能技术设计一个深思熟虑、循序渐进的发布过程的意图，但他们的宣传似乎没必要。”

OpenAI的政策主管Jack Clark将GPT-2置于该组织更广泛使命的背景下。他表示:“人工智能领域能够成功构建通用人工智能，那我们将需要大量说明如何处理AI领域高风险的研究的历史案例。但如果没有任何历史案例呢？那么就必须从现在开始着手研究，这就是OpenAI正在做的事情。

发表于: 2019-08-302019-08-30 15:11:00
原文链接：https://kuaibao.qq.com/s/20190830A0EXPD00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

OpenAI分段发布人工智能，一场如何处理高风险研究的实验

相关快讯

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐