首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

OpenAI发布可识别AI生成文本的分类器,试图缓解ChatGPT滥用乱象

OpenAI在发布对话语言模型ChatGPT之后,有鉴于其强大的语言能力可能在各领域遭到滥用,因此OpenAI发布反制工具AI生成文本分类器,该工具能够用于区分由人类编写或是人工智能生成的文本,用于辅助解决自动化误导性活动和学术欺骗等问题。

OpenAI日前推出功能强大的对话语言模型ChatGPT,能以对话的方式解决用户的各种问题,包括对程序代码进行调试,与用户讨论天文、数学和文学等各个领域的议题,ChatGPT也足够聪明被证许可通过大学商学院和法学院课程考试,但不少学生却利用ChatGPT编写报告或是论文,造成教学者的困扰。

为了缓解这样的乱象,OpenAI训练能够分类人类编写的文本,以及来自各供应商人工智能技术生成的文本,官方提到,虽然不可能完全可靠地检测出所有人工智能生成的文本,但能对宣称由人编写实则由人工智能生成的文本,提供一定参考价值的判断。

这个分类器是一种语言模型,OpenAI使用同一主题的人工文本和人工智能文本资料集微调InstructGPT,只要用户输入最少1,000个字符,约为150到250英文单词,分类器就会判断该文本是由人类编写还是人工智能产生。不过为求谨慎,OpenAI调整信度阈值以保持较低的误判率,因此即便分类器很有信心,也只会将文本标记为可能由人工智能生成。

OpenAI所发布的分类器并不完全可靠,在英文文本的评估中,分类器仅能正确地将26%的人工智能编写的文本正确分类,同时将9%由人类编写的文本,误判为人工智能生成,不过,分类器的可靠性,会因输入的文本长度增加而提高,与过去的分类器相比,这个新的分类器在判断人工智能文本上还是可靠许多。

官方提醒,目前分类器还有许多限制,不能当作主要判断的工具,仅可作为其他判断方法的补充。该分类器在少于1,000个字符的短文本非常不可靠,甚至更长的文本都会被分类器错误标记,分类器甚至有时候会将人类编写的文本,有自信地错误标记为人工智能生成。

目前分类器仅能用于成人编写的英文文本,可能会在儿童书写的文本和非英文文本上出错,同时,该分类器也无法用于识别高度可预测的文本,像是无法用于预测前1,000个质数是由人类编写还是人工智能生成,因为正确答案都是相同的。

其实只要稍微编辑人工智能生成的文本,就能够简单地回避分类器,官方提到,虽然他们的分类器能够更新并且再训练,但目前不清楚这种方式,以长期来说是否存在优势,而且也因为以神经网络为基础的分类器,在对训练集以外的资料表现很差,因此当用户所输入的文本跟训练资料集的文本有很大的差异,则分类器便会以高度信心做出错误判断。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230202A05KU400?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券