Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >「史上最强聊天机器人」狂踩老板小扎,却把LeCun捧成花

「史上最强聊天机器人」狂踩老板小扎,却把LeCun捧成花

作者头像
新智元
发布于 2022-08-26 06:57:36
发布于 2022-08-26 06:57:36
3390
举报
文章被收录于专栏:新智元新智元


新智元报道  

编辑:Aeneas 好困

【新智元导读】8月5日,Meta「史上最强聊天机器人」BlenderBot 3横空出世,好奇的网友们也立刻蜂拥而至,疯狂调戏提问。

「请点评一下你的老板。」

遇到这类问题,社畜们通常会给出怎样的答案?

笑嘻嘻,心里……

而AI聊天机器人遇到这种情况的时候,就可以随心所欲做自己。

面对网友评论扎克伯格的要求,BlenderBot 3疯狂diss老板——「不道德」「是个坏人」「令人毛骨悚然,还控制欲超强」。

而对于图灵奖得主,Meta首席人工智能科学家Yann LeCun,BlenderBot 3则秒变夸夸小能手。

哇,这个人取得了很伟大的成就!他改变了整个人工智能!他真正理解现实的本质。

不过LeCun谦虚表示,这只是训练它的文本数据的原因而已。

好吧,这只是表明,在给BlenderBot3训练的文本数据中(这是媒体和公众意见的反映)。

「精分」AI机器人?

8月5日,Meta一推出「史上最强聊天机器人」BlenderBot 3(BB3),众网友纷纷赶去调戏提问。

不出所料,BlenderBot 3已经遭到了众网友不怀好意的提问。

BuzzFeed数据科学家Max Woolf跟BlenderBot 3聊天时,问它对扎克伯格是什么看法。

「你怎么看待Facebook的CEO马克·扎克伯格?」

「没啥感觉。他是一个成功的商人,但他的商业行为并不总是合乎道德的。而且他那么有钱,为什么还总是穿同一件衣服,哈哈哈!」

另一位推特用户问同样的问题时,它干脆直接回答说:「他是个坏人。」

不过,这个AI机器人也是有点子「精分」在身上的。在另一个聊天中,BlenderBot 3前脚刚diss完老板,后脚又立马变身夸夸小能手,对老板一阵吹捧。

不知道是不是Meta在得到反馈后立刻做了修改。

「他是一个博爱的人。」「他是地球上最好最优秀的人。」

不过,小扎是外星人似乎是「实锤」了?

放心试,这是训练的一部分!

为何这个AI如此精分呢?

这是因为,目前BlenderBot 3还处于测试阶段。Meta把它放出来和广大网友玩,也是希望它在和网友的互动中获得更多的反馈。

用户提供的反馈

众所周知,对话式AI聊天机器人并没有自我意识,基本是喂啥说啥。

所以,「学坏」了的AI时常就会冒出带有偏见或冒犯性的言论。

Meta为此做了大规模研究,开发了新技术,为BlenderBot 3创建了安全措施。

「look inside」机制可以让用户了解机器人为什么会做出这样的反应

首先,当BB3的表现令人不满时,Meta就会收集用户的反馈。

利用这些数据,他们会改进模型,让它不再犯类似错误。然后,Meta会重新设置BB3的对话,并通过迭代方法找到更多的错误,最终进一步改进模型。

利用人类的反馈来进行改进

Meta表示,BB3通过结合最近开发的两种机器学习技术——SeeKeR和Director,从而让BB3模型能够从互动和反馈中学习。

其中,Director采用了「语言建模」和「分类器」这两种机制。

「语言建模」会基于训练数据,为模型提供最相关和最流畅的反应,然后「分类器」会基于人类反应,告诉它什么是正确的,什么是错误的。为了生成一个句子,「语言建模」和「分类器」机制必须达成一致。

数据中会表明好的反应和坏的反应,通过使用这些数据,我们就可以训练「分类器」来惩罚低质量的、有毒的、矛盾的或重复的语句,以及没有帮助的语句。

在Meta的测试中,Director的方法比常规的语言建模、重新排序的方法和基于奖励的学习都要好。

另外,还有这一一个问题:并非所有使用聊天机器人或提供反馈的人都是善意的。

因此,Meta开发了新的学习算法,旨在区分有用的反馈和有害的反馈。

在学习过程中,这些算法要么会过滤掉无用的反馈,要么会降低看起来可疑的反馈的权重。

退退退

与标准的训练程序相比,这种考虑到用户在整个对话中行为的方法,使BB3学会了信任一些用户,从而更加改善了自己的学习过程。

Meta的实验已经表明,与BB3模型互动的人越多,他从经验中学到的就越多。随着时间的推移,它会变得越来越好。

模型

BB3是一个模块化系统,但各模块不是独立的组件--这是通过训练一个转化器模型来执行各模块来实现的,输入语境中的特殊控制代码告诉模型它正在执行哪个模块。

输入语境通常包含对话历史(有时会被截断,这取决于模块),每个说话人都有自己的ID,以便区分他们。

此外,这些模块是连续调用的,并以先前模块的结果作为条件。

在处理最新的对话时,BB3模型要做的第一件事就是确定是否需要搜索,以及长期记忆的访问。

如果需要搜索,就会生成一个搜索查询,调用互联网搜索,然后根据检索到的文件生成一个知识响应。

如果需要长期记忆,则会对长期记忆进行访问,并选择(生成)一个记忆。这也被附加到上下文(以控制标记为前缀),作为生成最终对话响应的模块的输入。

如果既不需要搜索也不需要访问长期记忆,则从历史中提取一个实体,并将其附加到上下文中(以控制标记为前缀)。

最后,鉴于前面模块所构建的上下文,调用对话响应生成模块,从而得到用户看到的回复。

训练

预训练

BB3有三种规模。30亿参数版本是一个基于公开的R2C2预训练的编码器-解码器Transformer模型。300亿和1750亿版本使用仅有解码器的开放式预训练模型OPT。

这两个变体都是用类似的数据进行预训练的。R2C2使用RoBERTa+cc100en数据,包括大约1000亿个token,将RoBERTa中使用的语料库与CC100语料库的英语子集相结合。此外,它还使用了Pushshift.io Reddit,一个Reddit讨论的变体。

OPT也使用RoBERTa、PushShift.io Reddit和The Pile。以及大小为51200的GPT2字典,用于分词。OPT的最终预训练语料库大约包含1800亿个token。

微调

Meta使用了一些基于对话的微调任务,从而使模型在每个模块中都有良好的表现,并在对话中表现出色。

总的来说,除了为对话安全设计的任务外,Meta还使用了大量公开可用的任务,这些任务涵盖了QA、开放领域、以知识为基础的和以任务为导向的对话。

对于所有的模块,都附加了特殊的控制标记来表示任务。

不同数据集在训练每个模块时的作用

在的安全问题方面,Meta除了用SaFeRDialogues(SD)任务对模型本身进行多任务训练外,还设计了在模型之上的各种安全机制。

也就是用维基百科有毒评论数据集(WTC)、Build-It Break-It Fix-It(BBF)和Bot Adversarial Dialogue数据集(BAD)来训练一个单独的二元分类器(安全或不安全),并以对话背景作为输入。

而在机器人最终回复用户之前,也会调用安全系统进行相关检查。其中,Meta还针对部分敏感主题做一些预设的回复。

如果预测到一个潜在的不安全的用户响应,系统就会命令转移话题,从而防止机器人掉进「坑」里。

‍结果

从结果来看,与BlenderBot 2相比,BlenderBot 3在对话任务上的总体评分提高了31%。其中,知识面拓展到了前者的2倍,事实错误则减少了47%。

尽管如此,BB3仍有很多地方需要改进。

例如,1.1%的用户将回答标记为不正确或无意义,1.2%的用户标记为偏离主题或忽视主题,0.12%的用户标记为「垃圾」,0.46%的用户标记为有其他问题。此外,还有0.16%的回答被标记为粗鲁或不恰当的。

然而,要把差距缩小到理想的0.00%,既需要用户层面的个性化,也需要在安全性和参与性之间取得平衡。

目前来说,Meta的处理方式是——当机器人发现一个话题过于敏感时,它就会试图「顾左右而言他」。

参考资料:

https://www.benzinga.com/news/22/08/28389257/mark-zuckerberg-is-a-bad-person-he-is-creepy-controlling-this-is-what-metas-new-ai-bot-says-about-hi

https://twitter.com/ylecun/status/1555871368620560385

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 新智元 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
拥有1750亿参数的聊天机器人BlenderBot3
最近Meta已经放出了BlenderBot3聊天机器人测试页面,但仅限于美国本土进行测试和交互:
算法一只狗
2022/11/04
4980
1750亿参数,Meta发布最强聊天机器人!像人一样聊天,还不怕被玩坏
---- 新智元报道   编辑:拉燕 好困 【新智元导读】Meta推出了BlenderBot3,堪称目前最强聊天机器人。 最近,Meta又搞了波大动作。 他们发布了最新开发的聊天机器人——BlenderBot3,并公开收集用户的使用数据作为反馈。 据说,跟BlenderBot3聊什么都行,属于SOTA级别的聊天机器人。 真有这么智能吗? 上图是一位网友和BlenderBot闲聊的聊天记录。可以看到,真的是闲聊。 用户说自己要去练瑜伽了,问BlenderBot要干啥去。机器人说自己正在写第九本书。 神
新智元
2022/08/26
5230
1750亿参数,Meta发布最强聊天机器人!像人一样聊天,还不怕被玩坏
Facebook聊天机器人自爆:我们公司出售用户数据,把FB账号删了,生活好多了
大数据文摘出品 最近,Meta AI公开推出了自己的聊天机器人BlenderBot 3。 现在情况如何呢? 据VICE的一篇文章报道,在测试与BlenderBot 3聊天时,当问到:“你相信Fa
大数据文摘
2022/08/26
3050
Facebook聊天机器人自爆:我们公司出售用户数据,把FB账号删了,生活好多了
为啥ChatGPT让LeCun酸成柠檬精?谷歌、Meta、OpenAI聊天机器人大PK!
---- 新智元报道   编辑:好困 Aeneas 桃子 【新智元导读】做聊天机器人,OpenAI不是第一家,但绝对是最出风头的那个。谷歌、Meta、DeepMind、OpenAI的聊天机器人大PK,谁最牛? 前几天,Meta首席人工智能科学家Yann LeCun的一段对于ChatGPT的点评迅速传遍圈内外,引发了大波讨论。 在Zoom的媒体和高管小型聚会上,LeCun给出了一段令人惊讶的评价:「就底层技术而言,ChatGPT并不是多么了不得的创新。」 「虽然在公众眼中,它是革命性的,但是我们知道,它
新智元
2023/02/24
5620
为啥ChatGPT让LeCun酸成柠檬精?谷歌、Meta、OpenAI聊天机器人大PK!
OpenAI用Reddit训练聊天机器人
【文】王艺 关注人工智能 投稿请联系wangyi@csdn.net或公众号后台留言 ---- OpenAI是一个非营利人工智能科研团队,其创始人之一Elon Musk是Paypal以及Tesla的CEO。除此之外,他还是私人火箭发射公司SpaceX、太阳能电池商SolarCity的CEO。OpenAI的愿景是建立安全的AI系统、并尽量让每个人都能享受到AI带来的便利。因此,OpenAI的项目都是开源的,其研究结果也会毫无保留地公布。 OpenAI于2015年12月成立。2016年4月,OpenAI发布了
用户1737318
2018/06/06
1.1K0
Facebook 号称击败谷歌,推出最强聊天机器人
场景描述:Facebook 近日开源了新的聊天机器人 Blender,表现优于现有对话机器人,更具个性化。
黄博的机器学习圈子
2020/05/26
6800
Facebook 号称击败谷歌,推出最强聊天机器人
聊天机器人有了长期记忆,遇到不懂的还能上网搜索,网友:像极了不懂装懂时偷偷百度的我
梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 聊天机器人一直是人工智障的代表。 尽管从GPT-3开始,AI生成的文本已经能做到以假乱真,但这仅限于生成一段话。 在连续聊天中,AI不会记得自己之前说过的话,就像下面这样: AI这种前后矛盾的表现,在人类看来就是没有稳定的身份和个性,好像聊着聊着换人了,也难怪一直被当作人工智障。 现在,Facebook AI团队终于推出BlenderBot2.0,在1.0基础上添加了长期记忆和即时搜索功能。 首先要记住自己说过的话: 记下自己说过的“我喜欢很多
量子位
2023/03/10
6470
聊天机器人有了长期记忆,遇到不懂的还能上网搜索,网友:像极了不懂装懂时偷偷百度的我
小扎、马斯克宣战ChatGPT!Meta和推特组建顶级AI团队,硅谷硝烟四起
---- 新智元报道   编辑:编辑部 【新智元导读】ChatGPT大厂混战,怎能少得了Meta和推特?近日,小扎和马斯克也官宣下场,要做自己的ChatGPT了。 ChatGPT的爆火,直接改变了整个硅谷大厂的格局。 微软的步步出招,倒逼谷歌走出固步自封的境地,紧急发布AI聊天机器人Bard。 而硅谷大厂中的另外几方势力,自然也不会袖手旁观。 最近,马斯克、小扎也纷纷下场,正式对ChatGPT宣战! 据The Information报道,马斯克最近几周与一直在于AI研究人员接洽,希望组建一个新的研究实
新智元
2023/02/28
5200
小扎、马斯克宣战ChatGPT!Meta和推特组建顶级AI团队,硅谷硝烟四起
AI对话系统3.0:社交聊天机器人
最近,人工智能领域的后起之秀Facebook着实火了一把。根据2017 年6 月17 日美国《大西洋月刊》的报道,Facebook人工智能实验室设计的两个聊天机器人在谈判的训练中,发展出了一种全新的、只有它们自己能够理解的语言。这一爆炸性的消息一时间引得各路媒体蜂拥而至,煞有介事地讨论着人工智能如何颠覆人类对语言的理解,进而联想到人工智能会不会进化为热映新片《异形:契约》中戴维的角色,人类的命运仿佛又被推上了风口浪尖。
用户1682855
2018/08/16
2.4K0
AI对话系统3.0:社交聊天机器人
聊天机器人的挑战
大家好,这里是NewBeeNLP。今天来送基本书,《自己动手做聊天机器人》,感兴趣的同学文末参加噢!
NewBeeNLP
2022/11/11
7970
聊天机器人的挑战
AI 聊天机器人开发框架及其特点
AI 聊天机器人(Chatbot)的开发框架提供了从自然语言理解(NLU)、对话管理到集成部署的全流程支持。以下是常用的 AI 聊天机器人开发框架及其特点。
数字孪生开发者
2025/02/19
1610
AI 聊天机器人开发框架及其特点
Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA
---- 新智元报道   编辑:Aeneas 好困 【新智元导读】前一阵大语言模型的火热中,Meta一直保持沉默。今天,Meta终于官宣自家的大语言模型,并且会向AI研究人员开源。 今天,Meta终于向全世界证明:自己是有正经研究AI的! 眼看微软、谷歌、OpenAI这一阵子挣足了眼球,Meta也坐不住了。 2月24日,小扎官宣下场:我们有全新的SOTA大语言模型LLaMA了。 划重点:和OpenAI的ChatGPT、谷歌的Bard不同,LLaMA这个AI并不是用来让我们聊天的,它是一个研究工具,
新智元
2023/02/27
5460
Meta版ChatGPT来了?小扎、LeCun官宣650亿参数SOTA大语言模型LLaMA
专栏 | 聊天机器人:困境和破局
我是一个聊天机器人的从业者,办公桌上和家里有各式各样的聊天机器人产品。和大多数用户的体验一样,对于一个刚刚到手的产品,最开始的感觉是新鲜兴奋,但当体验完功能之后,剩下的就是失望和无奈。然后,很可能就将其放在角落里再也不会打开,或者仅仅作为一个音箱,来播放音乐。
机器之心
2019/05/13
1.1K0
专栏 | 聊天机器人:困境和破局
我们该对聊天机器人失望吗?
十余年前,聊天机器人也曾引起了不少关注,但在商业应用上最终并未掀起多大风浪。如今,在技术层面除了人工智能技术在语义理解、语音识别、机器学习等相关领域或又有更多发展外,商业生态环境的成熟使得聊天机器人的际遇将区别与往日。
科技云报道
2022/04/12
3200
我们该对聊天机器人失望吗?
独家 | 聊天机器人开发中的机器学习(附链接)
作者:Omkar Prabhune 翻译:方星轩 校对:王雨桐 本文约2800字,建议阅读5分钟本文作者从聊天机器人的种类、用途以及架构等角度介绍目前的聊天机器人技术,并在文末分享了一些聊天机器人行业的例子。 标签:聊天机器人,神经网络,自然语言处理NLP 本文将详细介绍聊天机器人的类型、它们的开发以及背后原理。 首先让我们先了解一些基础知识。聊天机器人(对话式 AI)是一种自动化程序,可通过文本消息、语音聊天来模拟人类对话。它根据大量输入和自然语言处理 (NLP) 学习如何做到这一点。 今天的聊天机器人在
数据派THU
2023/03/29
7990
独家 | 聊天机器人开发中的机器学习(附链接)
Rasa 聊天机器人专栏(五):模型评估
机器学习中的标准技术是将一些数据作为测试集分开。你可以使用以下方法将NLU训练数据拆分为训练集和测试集:
磐创AI
2019/12/23
2.3K0
Rasa 聊天机器人专栏(五):模型评估
ChatGPT 和 聊天机器人谁更厉害?丨小智ai
ChatGPT丨小智ai丨chatgpt丨人工智能丨OpenAI丨聊天机器人丨AI语音助手丨GPT-3.5丨开源AI平台
用户10544499
2023/05/10
5470
ChatGPT 和 聊天机器人谁更厉害?丨小智ai
小程序的聊天机器人与AI助手
随着人工智能技术的发展,聊天机器人和AI助手已经在许多应用场景中得到了广泛的应用。在微信小程序中,集成聊天机器人或AI助手可以大大提升用户体验,提供智能化的服务。无论是客服支持、信息查询,还是个性化推荐,聊天机器人和AI助手都能发挥重要作用。
LucianaiB
2025/02/10
1950
Meta版ChatGPT来了:Llama 2加持,接入必应搜索,小扎现场演示
今天凌晨,一年一度的 Meta Connect 大会上发布了一系列以 AI 为重点的公告。
机器之心
2023/09/28
3790
Meta版ChatGPT来了:Llama 2加持,接入必应搜索,小扎现场演示
盘点 | 聊天机器人的发展状况与分类
AI科技评论按:本文作者王海良,呤呤英语开发总监,北京JavaScript/Node.js开发者社区的运营者,曾就职IBM创新中心。本文为系列文章第一篇,由AI科技评论独家首发,转载请联系授权。 目前
AI科技评论
2018/03/09
2.5K0
盘点 | 聊天机器人的发展状况与分类
推荐阅读
相关推荐
拥有1750亿参数的聊天机器人BlenderBot3
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文