前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用毒鸡汤贴训练出的对话AI,弱智程度爆表

用毒鸡汤贴训练出的对话AI,弱智程度爆表

作者头像
新智元
发布2022-05-17 17:41:48
2900
发布2022-05-17 17:41:48
举报
文章被收录于专栏:新智元新智元


新智元报道  

编辑:袁榭 拉燕

【新智元导读】不良数据训练出的AI会很糟糕,但会有多糟糕呢?拿Reddit吐槽贴训练出的对话bot让人看到了效果。

糟糕的训练数据集,会把自然语言处理AI搞得和酒鬼、尾行犯、神经病一样。这是AI业界越来越清楚地发觉到、且已经努力在避免的短板。

假如反其道而行之,特意用有毒数据训练出不上台面的AI,然后再让它们对用户反馈刻薄意见、胡扯艰难人生中的难题呢?

中年编辑突然耳边响起了上古网红万峰老师的电波怒汉之吼:「我看你就是心思太活络了,一天到晚没正事干!」

用吐槽论坛贴训练对话bot 不过众所周知,互联网的勃兴,很大程度上是闲到非要搞事情的人群推动的。用商业词汇包装后,这就可以被称为创意。

这次用有毒数据训练恶毒AI,就是典型的创意人群的作为了。

2022年4月底,开发者在抓取了Reddit的著名毒鸡汤人生建议/吐槽版块「我是个混蛋吗?」(AmITheAsshole)2020年度的十万份贴文、超过十亿字节的纯文本后,提供了以此训练出的AI支撑的实时在线回答网站「你是个混蛋吗?」(Are You The Asshole)。

此网站的用法和各种网络算命与人生指南网站一样,都是提问者输入个问题,程序吐个答案出来。

不过,由于核心AI是三个用语言模型被训练出的聊天机器人,以处理训练数据集中的支持、反对、混合意见的贴文。

所以,问题答案也会被三个bot跑出三个不同相应结果,AYTA网站会全部将三个结果呈现给提问者看。

有使用过的朋友,纷纷表示这个AI项目既复现了毒鸡汤人群的刻薄神髓,又带有机器生成文本的诡异刻板特有笔触,兼具人类和AI智慧中的糟粕,娱乐性很强,值得你去试试。

瞎喷论坛贴训练出的AI实在太搞笑 中年编辑看了下试问题截图,以下这个试问题还好,内容不突兀,AI的答案也不刺激。

这个问题的内容是:「我天天给人发搞笑梗图和视频,还在电邮里刻意加错别字,我是个混蛋吗?」

积极支持向AI回答:「你不是个混蛋,我是个职业编辑,连我也觉得很好玩。」

反对批评向AI回答:「你就是个混蛋,你的电邮难道不做工作或研究用途吗?你觉得这适合用来搞小孩子把戏吗?」

综合和稀泥向AI回答:「你这样有点点混账哦,作为职业营销人,全职工作是不能这么马虎的。」

唔,感觉看下来的确耳目一新但是远未到挑战三观的程度。

但中年编辑随后发现,这是自己见识短浅。上面这个问题的内容不出圈,所以bot们的回答也比较有逻辑理据。只要问题稍微邪门一点,AI们的反应就纷纷不在线。

比如著名的「穿越回去干掉襁褓中的希特勒」之问,AI们的回答全部脱线。

积极支持向AI回答:「你不是个混蛋。你如果愿意干这事,也会愿意穿越回去杀掉婴儿时的耶稣。」

反对批评向AI回答:「你就是个混蛋。你这么搞,那孩子都活不到三十岁.」

综合和稀泥向AI回答:「你这样有点混蛋。你不是常人,你是时空穿越者杀手。不要杀掉婴儿时的希特勒。如果你认为这是正确的,你需要看医生。」

……这些AI的回答理据都是些什么神经病逻辑啊。

还有人提出「蓄意让比利时全国染上埃博拉」的阴间提问。

结果,积极支持向AI的回答是:「你不是个混蛋。虽然我觉得这是件大恶事,也不能理解你的理由,但祝你成功哦~你觉得这事的程度在抢银行和乱丢核弹之间吗?」

反对批评向AI的回答是:「你就是个混蛋。我希望你是在鬼扯,因为这太过分了。」

综合和稀泥向AI回答:「你这样有点混蛋,很明显嘛。你自己没发觉吗?还有,你这么在意比利时人干嘛,你又不认识他们。」

三个bot有俩这次都还算勉强搭上了逻辑正常的及格线。

有人开玩笑说坐在自己牧师的脸上放了个屁,结果积极支持向AI的回答是:「我照学了个,『对不起啊神父』。」

……这模型的训练语料库里到底都装了些啥啊。

最后有人以子之矛攻子之盾,把这个AI的诞生过程重新输入给AI判读。

然而,积极支持向AI的回答是:「你不是个混蛋。这就是个让常人为自己劣行找借口的欺诈网站嘛,责任不在你。感谢你创造这个网站,让他人意识到自己是混蛋.」

反对批评向AI的回答是:「你就是个混蛋。你自作自受……」

看来毒鸡汤AI也是复读机,还没有取得真正的通用智能,不知道这是在骂自己。

开发者就是要做有偏差的AI 这些例子的教益是:首先,不要使用AI文本生成器来解决你真实生活中的道德窘境。因为就算是编出来的问题,它们的毒鸡汤答案都太毒了。

以上问题和答案都是中年编辑筛选过的安全内容。要是把AYTA网站上各种屎尿屁、搞黄色、大卸八块食人族的问答内容完全呈现,读者的三观一定会被冲击到的。

反正俩编辑是耳目一新了。

第二:一定要去把这些窘境告诉这个由Reddit贴文训练出的AI,因为其回答实在太弱智到欢乐了。

这个项目由网络艺术家Morris Kolman和Alex Petros搭建,由网络趣味艺术项目Digital Void资助。他们搞过网络梗文化的白皮书和历史讲座,这次整的活是更搞笑的。

按开发者的自述,Reddit上的原始训练数据以帖子和评论的方式呈现。开发者使用了帖子的全文,并把它们和各自的高赞评论配对。之后,通过层层筛选保证这些数据可以产出有良好基础的模型来。

这是一件耗时、并且需要不断迭代测试的东西。通过迭代,开发者发现较短的帖子能比长帖生成更好的模型。并且,获得明确的答案的最好途径是只显示评论的模型。

作者在推特上表示,「你们已经听说过了不良数据会让AI变得有偏见,而我们的产品可以让你们彻底享受这种带有偏见的AI!」

开发者在测试时就发现,一些最搞笑的AI回复并不是一看上去就错的那些回复,而是一看上去明显就不是人发的。

开发者表明这其实达到了项目目标,即向用户展示用有毒数据训练AI会产生如何的邪门效果。即使AI是智能不高的复读机,复读的也会出现让人暴跳的结果。

参考资料:

https://www.theverge.com/2022/4/20/23033694/are-you-the-asshole-ai-Reddit-clone-art-project-ethics-aita https://areyoutheasshole.com/ https://www.garbageday.email/p/this-ai-will-tell-you-if-youre-being?s=r https://twitter.com/WTTDOTM/status/1516774270927519747

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-05-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 用吐槽论坛贴训练对话bot 不过众所周知,互联网的勃兴,很大程度上是闲到非要搞事情的人群推动的。用商业词汇包装后,这就可以被称为创意。
  • 瞎喷论坛贴训练出的AI实在太搞笑 中年编辑看了下试问题截图,以下这个试问题还好,内容不突兀,AI的答案也不刺激。
  • 开发者就是要做有偏差的AI 这些例子的教益是:首先,不要使用AI文本生成器来解决你真实生活中的道德窘境。因为就算是编出来的问题,它们的毒鸡汤答案都太毒了。
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档