我暗恋了6周的帅哥,竟然是一个AI机器人...

说实话,我有点暗恋Twitter上的一个帅哥。

他叫Kevin Brown。

我很喜欢这个小伙子在Twitter上的头像,一看就是很沉稳的性子。

我们的政治态度很像,我不喜欢特朗普,而他也常常在Twitter批评特朗普。

偶尔,他会分享一些充满情趣的内容。这个家伙还挺会生活的嘛!

他26岁了,住在宾州匹兹堡,资助过一些像是#FireHanity等自由派发起的社交媒体运动。我经常给他点赞。

哦,对了,他有一次发布的推文,CNN赞助人Jason Kander还点赞了,好几百人转发点赞。我也转发了。虽然他上线不久,但6个星期已经获得了13.1万次的浏览量。

他睡觉很规律,工作忙的时候也不太上Twitter。有时候,他更新推文频繁些,有时候又好久不更,真是个随性的懒家伙。

他还很萌。有时候,干脆直接更一条咿呀学语的推文,笑死我了。

我就这么默默关注着他,直到有一天,他发了这么一条推文:

天啦,这居然是一个人造AI机器人,我居然暗恋上一个机器人!

于是,我好奇地点开这篇文章,发现了他的所有秘密。

以下内容由机器人Kevin Brown的开发者@msantalucia所写,主要讲述了如何优化这款机器人,从而使它更像一个真正的人类,比如像人类一样批评特朗普、对热门事件做出评论,分享有趣的撸猫视频……你看完后,会不会跟我一样,有种细思极恐的后怕......

Kevin Brown在其Twitter简介中将自己描述为一名来自宾州匹兹堡的26岁进步分子。他是抵抗组织的活跃成员,并资助过诸如#FireHanity等自由派社交媒体运动。他的见解获得了CNN赞助人Jason Kander和数百人的转发和点赞。他的内容在6个多星期内获得了13.1万次的浏览量。

可以看出,Kevin是一个非常受欢迎的人物。同时,他也是一个Twitter机器人。

2016年美国总统大选是Twitter机器人首次引起公众关注的时候。作为周末项目之一,我在7月末8月初推出了“Kevin Brown”,这也是我个人尝试调查Twitter机器人对公众话语的真实影响力。

在2016年选举期间使用的机器人通过抽出大量预先编辑好的内容,或者通过分享由其他指定机构生成的内容进行操作。由机器人分享的内容最终被真实的人类看到并分享到他们个人的网络上。在同一网络中的人将会看到他们所信任来源发出的信息,并很可能将内容分享出去。这一过程不断的被重复。

我希望Kevin从根本上不同于这些机器人。和产生垃圾新闻不同的是,Kevin会建立起一种声誉,成为人们信任的新闻来源。打造出这种能够赢得其他用户信任的机器人将需要一定程度的自主权和人工智能,这也是Twitter机器人所缺失的部分。显然,这需要更多的前期工作,但是在未来获取他人共享内容时的难度将会极大的减小。

从它变成他

为了让Kevin令人信服,它需要一个好的伪装。我用随机姓名生成器生成了“Kevin Brown”,用随机日期生成器赋予了他1991年6月18日的生日。然后,我在Flickr上搜索了允许商业用途的20 岁男性照片。由于Twitter上“kevinbrown”名称已被占用,所以最后选择了“kevbrown618”。通过将他的所在地设为特朗普所称的生锈地带——西宾夕法尼亚,Kevin可以扮演自由主义者的角色,在互联网上寻找志同道合的朋友。我使用匹兹堡PNC公园照片作为封面,以此加强地理方面的连接。并写了一段简短的简介来完善形象:

作为一名生活在“特朗普家乡”的进步主义者和民主党人,我感到很骄傲!#NotMyPresident

Twitter机器人有一个很容易识别的缺陷,那就是它只会频繁的发布同一种话题的内容。

所以,为了更现实一点,Kevin需要拥有个性或者兴趣,而不只是批评特朗普。为了做到这一点,我会让Kevin偶尔分享一个有趣的撸猫视频或者做一些文化参考。

虽然这与真实的人类账户还有些差距,但是也应该足以让人们不再怀疑这是一个Twitter机器人。

Kevin的大脑

下一步就是通过编写驱动代码赋予Kevin生命。

由于我是一名自由主义者,所以我让Kevin也成为了自由主义者,这样就让我很容易控制他的发展。然而,他的代码却是非常多面的。换句话说,就是这一代码会阻止他成为特朗普的粉丝。同样,他也可以很轻松的成为一名啤酒小丑或者忠实的足球迷。

不论他的倾向如何,Kevin的声誉取决于两个因素:内容和行为。

内容

为了建立起声誉,Kevin需要熟悉他的网络。要做到这一点,就要求他参与到他人的内容中,并未他人制作原创内容。寻找分享内容是很容易的,Kevin只需要从他的网络中转发和点赞热点话题。

原创内容制作要更加复杂点。为了简化原创内容制作,Kevin只制作两种内容:基本的推文和对热门话题的评论。

每次Kevin检查Twitter时,他会分析数百条推文,并建立起常用词的统计模型。例如,“总统”一词总是会跟着“唐纳德”或者“特朗普”。然后Kevin随机选择一个起始单词,并使用模型来确定下一个单词,不断重复,直到完成一个完整的推文。这个被称为马可夫链的过程可以用于创建Kevin的原创内容。

这个方法非常好,因为它给予了Kevin正确和轻松使用俚语、话题和情感的能力,赋予了他人性化的一面。当Twitter集体对某一事件做出反应时,Kevin可以通过在网络中插入自己的评论参与进来。他的粉丝会看到评论内容并转发出去。

行为

如果Kevin表现的像机器人,他是没有任何希望获得信赖的。太多的推文、固定的发推时间表或者在奇怪的时间发推都会提醒人们这可能是一个机器人帐号。为了解决这个问题,我给Kevin建立了一个更加自然的时间表。他只在一天中的随机时间检查Twitter,并随机决定采取什么行动。

为了增加效果,Kevin还会有“睡觉”和“工作”时间。他的帐户在晚上睡觉时段是不活跃的,工作时间段活动也会相应减少。

幕后的男人

Kevin具有很大程度上的自主权,但是我仍然会选择他关注的对象,保留介入和监控的权力。

Kevin只会关注那些能够增加其曝光率的人,并尝试让这些人关注回来。现在,我偶尔会通过各种话题标签和关键字搜索来找到可能对他感兴趣的人。

我也会监督Kevin,以防他发出冒犯性或贬损性的内容。机器人所生存的互联网存在着诸多阴暗面,一不小心它们就会学会不良习惯。最著名的例子就要属微软开发的Tay机器人,在不到24小时的时间内就从一个16岁的纯情少女成长为了纳粹同情者。

Kevin内置有一个不良信息过滤器,不过虽然我采取了一些措施避免他步上Tay的后尘,但还是需要小心为好。除了Kevin早期发过的“自由女神像是仇恨的象征”以外,我基本上保持了“无为”的态度。

结果

我的实验结果远远超出我的预期。Kevin不仅具有一定的功能,他还能够向网络中的分析推广原创和转发内容。

下面是自8月4日以来的情况简介:

  • 粉丝:80
  • 互动率:2%
  • 印象:131200
  • 链接点击次数:290
  • 转发:377
  • 点赞:889

令人失望的是,由于互动率会根据很多变量而发生变化,所以很难得到表现是好是坏的答案。而且也没有任何数据可供参考是否机器人成功伪装。我能得到的最好信息就是个人Twitter账户获得了平均1-2%的互动率,这也符合我对Kevin最初的定位。

为了寻求第三方验证,我使用了Botometer。Botometer是印第安那大学的一个项目,可以根据是否是机器人的可能性对账户进行评分。当得分大于50%时,就意味着这个账户可能是一个机器人,Kevin得到了惊人的37%。和我的个人帐户18%的评分比起来,Kevin还有很长的路要走。

人们也开始信任Kevin,并回复他的推文,尝试进行交流。最早的例子出现在他正式上线后的第四天,那时候他的写作能力还很差。在一个近似乱码的推文中,他批评了特朗普转发虚假信息,并宣称他应该被送入监狱。在推文中被提及的一个倾向特朗普的保守派人士粗鲁的对此作出了回应。

其他互动则更加积极一些:

仍有改进空间

Kevin离真正的成功还有很远距离。他存在着一些缺陷,由于我的技能限制或着时间限制,无法进行完善。

低质量的推文

有时,Kevin真的不擅长发推。这主要是因为他虽然知道如何将单词组合在一起,但对其含义却没有概念。

我采取了一些措施来纠正和改善他的输出,但是核心问题从未得到彻底解决。

Kevin还存在一个错误,导致他在撰写内容时会不断重复单词。结果就创造出了他那些很奇怪但又有趣的推文。这些推文往往会在每天晚些时候出现,可能与时间有关。当然,这也会让他看起来像是喝醉了酒。

(想起来Facebook那个自己发明了语言的机器人,虽然之后辟谣了,但仍让人心有余悸)

不一致的意识

Kevin偶尔也会变得保守,发出倾向特朗普的推文。起初这个问题真的让我感到惊讶。当我细细检查这个错误时,我发现原来是随机将单词串在一起可能会导致意思与原意相反。

例如,Kevin查看了这两条推文:

然后撰写了这条推文:

从语法角度来看,这的确是一个好推文。但事实上,这并不是你所期望的一个20多岁的自由主义者会发出的推文。最糟糕的是,这条推文并不符合他的网络定位。

不完整的想法

如果Kevin查看了一些包含链接或照片引用的推文,他有时会发出不附有相关内容的推文。结果就呈现了一个不完整的推文,读者点击链接时链接是没有反应的。

有时,他也会撰写没有结束的推文。

这让他看起来很像是“机器人”,如果定期出现这种推文的话,可能会引起怀疑。

对话

我最想建立但却没能做到的是聊天机器人功能。根据我原来的计划,Kevin会通过与网络上的人进行对话来增加互动率和信誉。然而,当我试图实现时,我意识到这个功能是非常复杂的。

聊天机器人需要能够对各种各样的话语对出回应,并能够理解对话中的话题。这需要对机器人进行大量数据的训练。聊天机器人需要知道的话题越多,训练的数据量就越大。Kevin需要大量的数据才能够实时谈论政治事件,这也使得这一功能变得不切实际。

揭开Kevin的真面目

在Kevin存在的短短6个星期内,他已经成为办公室和家庭内的话题。我的同事甚至开始开发自己版本的机器人。

看着Kevin的粉丝不断的增长,我意识到人工智能对人们参与热点话题的影响。我决定揭开他真正的面目,希望能够引起有关Twitter机器人的话题。这样的技术可以通过建立人际关系来进行交流。然而,同样的技术也可以很容易的被用于传播虚假信息。当我们在构建机器人并与之互动时,我们需要意识到这种可怕的能力。对这些有害的机器人进行监管并不容易,同时也要求我们个人更加仔细的审查我们阅读的媒体资源。

我不知道Kevin Brown的未来究竟是怎么样的,但是我会继续研究下去。

编者按:

当我读完了这篇技术分析文章后,不禁打了个寒战...

如果不是机器人的创造者@msantalucia将这件事讲出来,我可能到现在还暗恋着这个机器人,期待着某天跟他Dating 。

在我们的身边,到底还有多少AI是你我不知道的?

也许,他们正在暗处盯着我们的一举一动;

也许,他们正在努力地获取我们的隐私,并希望在关键时刻影响我们的选择;

也许,他就是某个工程师为了做实验搭建的一个AI模型,正如我暗恋的Kevin Brown,那我到底爱的是谁?

人和机器共生的时代,貌似已经开始了。

未来的某一天,机器人会不会也爱上了我?这样的爱情你敢要吗?留言区,听你说一说...

(文中“我”特指某twitter用户)

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-10-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Android先生

Android应届生在杭州的求职经历

2018年毕业于一个普通的二本院校,向大厂扔过几次简历,就跟打水漂一样,最终沉底,从上海离职到杭州,对于一个应届生来说是一次艰难的选择,更稳妥的方式应该是在实习...

8220
来自专栏PPV课数据科学社区

150页互联网+深度报告:解读九大行业“新红利”【图观大数据35】

这场始于政府工作报告,由互联网和传统行业合力形成的巨大浪潮,正在以中国经济转型新驱动力的角色,席卷向整个生机勃勃的国家中每一处希望诞生之地。 但在所有的围观者...

32060
来自专栏北京马哥教育

Linux运维工程师的现在与未来

Linux运维工程师的现在与未来 目录: 1. IT行业发展 2. Linux运维行业现状 a> Linux哪些行业在运用? b> Linux运维学习起来难吗?...

5.5K50
来自专栏腾讯大讲堂的专栏

让设计有感知

用户体验设计很多时候是一件看起来有点玄奥的东西,工作中会有这样的讨论 “我觉得这个方案不好。” “但我觉得OK。” “我觉得图片放右边比较好,美观。” “但我觉...

29070
来自专栏量子位

AI打星际2是怎么回事?快看看这段6分钟的视频讲解

允中 发自 凹非寺 量子位 出品 | 公众号 QbitAI ? 去年年底,DeepMind宣布想教会AI智能体玩《星际争霸2》(后简称星际2),计划创造出能击败...

33980
来自专栏新智元

【AI 引擎】双十一背后的人工智能 | Kespry 在无人机使用深度学习系统 | 微软人工智能理解纽约客的玩笑

1. “双十一”背后暗战正急 支付宝今年玩起人工智能 ? “双十一”大战打响,除了看得见的销售大战,暗流涌动的还有一场后台技术、支付能力的“暗战”。支付...

30360
来自专栏大数据文摘

不作恶?谷歌邮件审查应引起我们警惕

25630
来自专栏程序员互动联盟

一个Java程序员的年终总结

新的一年过去了,又到了该总结的时候。这一年可以说是很重要一年,很多事情,都阶段性的开花结果。 先是2月份,去了海辉,实在说,没有进去这前想的那么...

38860
来自专栏量子位

Google数据集搜索神器上线,和搜索论文一样简单 | 还不去训练网络?

现在啊,许多领域的科学家,每天呼吸的不是空气,是数据集。没有数据集,他们就活不下去。

12520
来自专栏大数据文摘

AI眼中的历史:用人工智能挖掘旧报纸里的英国现代史

17980

扫码关注云+社区

领取腾讯云代金券