谷歌这个AI“吵架预防器”,可带你提前远离杠精们

林鳞 编译整理 量子位 出品 | 公众号 QbitAI

这是一个由互联网催生的“杠精”充斥的时代,想必你一定遇到过。

回想一下,你在微博上针对问题提出看法,几小时后发现一队人马@你排队挑衅,他们奉行“只对人不对事”和“以抬杠为己任”的基本原则,试图和你吵架。

前方注意⚠⚠⚠,一大波杠精来袭。

请问客官,预防吵架的特效神器要不要了解一下?

近日,Google旗下的科技孵化器Jigsaw、康奈尔大学和维基媒体基金会合作,联合开发了一个预测谈话走向的AI系统。

这个系统能从一开始就能预测谈话是否会失控,想在对话能被挽救的情况下,尽早预防不必要的争吵,活脱脱一个“吵架预防器”。

检测元件

在今年ACL大会收录的论文Conversations Gone Awry: Detecting Early Signs of Conversational Failure中,Lucas Dixon和Nithum Thain等人通过分析维基百科中的讨论页面,收集了1207次谈话,当做训练数据。

其中,一半对话最终发展成攻击性言论,另一半数据仍然为礼貌交流。研究人员通过使用Jigsaw的Perspective API识别有害言论,并收集人类标注的标签作为数据集。最终,一组对话的平均长度为4.6条。

检测原理

至此,数据集☑。

随后,研究人员开始分析这些对话中的关键词有怎样的特征。

他们通过“表示礼貌的语用手段”将对话分类。这是一系列特征,并且与谈话的感情走向一致。无论是对话中包含友好的礼貌用语(比如“谢谢”、“请”等词语),还是表达了希望继续探讨的积极用语(比如“我认为”“我觉得”),它都能识别出来,并依此分类。

然后,研究人员分析了结果和最初的评论,看看他们的系统是否能学会预测将来是否会产生负面评论。

效果展示

当当当当,杠精预防发生器在一系列努力后终于完工。

研究人员做了一个测试,人类成功预测了大约72%的恶意对话,这个AI系统最终预测准确率达到61.6%。

此外,研究人员还得出了一些统计相关性,可以帮助人类和机器更好地发现那些容易出现攻击评论。“我们粗略发现,言语越直率,遭到个人攻击的可能性越大。”这一效应与我们的直觉一致,即太直接的表达暗示了交谈中潜在的敌意。

为了便于以后的探索,研究人员还将数据和代码整合,作为康奈尔会话分析工具箱的一部分。

附赠说明

对了,关于这个杠精预防发生器的更多说明,可以查看它的原理说明:

https://arxiv.org/abs/1805.05345

康奈尔会话分析工具箱地址:

https://github.com/CornellNLP/Cornell-Conversational-Analysis-Toolkit

对了,文中提到的Perspective API已上线,需要的话自取吧~

https://perspectiveapi.com/#/

虽然有吵架预防器的保护,还是要谨记八字箴言“珍爱生命,远离杠精”呀。

作者系网易新闻·网易号“各有态度”签约作者

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-05-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏奇点大数据

如何看待人工智障?

在这之中,有很多人其实对人工智能是持有怀疑态度的,或是无神论者或是有神论者,持有这种观点的人都是大有人在。

1093
来自专栏CreateAMind

博士这五年 (非常值得学习!)

王威廉:根据我的观察,CMU优秀博士生的一个共同特点就是自己主导研究,推着(push)导师走,而不是被导师催着干活。不论是早期的李开复,后来的沈向洋,还是现在年...

2252
来自专栏钱塘大数据

【揭秘】复联中的灭霸原来是这么设计出来的!

票房屡创新高,观众好评如潮,《复联3》可谓是当下最热门的电影。作为漫威系列电影第一段的终结,迪士尼和漫威公司在这部电影上豪赌一把,76个漫威角色齐聚一堂。然而汇...

2295
来自专栏量子位

把深度学习计算机做到1立方毫米大小,这群科学家想干什么?

量子位 李林 | 编译自IEEE Spectrum ? 计算机科学家David Blaauw从包里拿出一个小小的塑料盒,打开,用指尖小心翼翼地捏起里面一个小黑点...

3637
来自专栏计算机视觉战队

人证核验系统解决方案

方案概述 随着各地平安城市建设的积极深入和依法治国战略方针的全面推进,中共中央办公厅、国务院办公厅于2015年印发了《关于加强社会治安防控体系建设的意见》。意...

6847
来自专栏AI科技评论

学界 | Facebook 最新研究:自主学习一个会和世界互动的智能体

AI 科技评论按:本文由来自 Facebook 人工智能研究院的研究员 Dhruv Batra 和 Devi Parikh 共同撰写,文中介绍了 Faceboo...

1202
来自专栏Data Analysis & Viz

知乎上8个100K+高赞回答(筛选自63万个回答)

最近知乎首页上老是看到这个话题:《知乎上的高票答案就是好的吗?》,很好奇目前高赞回答都有哪些?各有多少赞同数?于是继续这些天爬知乎数据的节奏,以大小V主页的回答...

1193
来自专栏互联网杂技

交互设计师必看:怎样让你的线框图发挥出真正价值?

初级设计师的设计进程 ? 以上这则小插图是从大神Julie Zhou的文章,Junior Designers vs. Senior Designer(初...

3489
来自专栏量子位

便宜可靠的激光雷达可能要来了!Luminar关键部件成本降到3美元

激光雷达(Lidar)比车还贵的价格和永远缺货的状态,已经成了无人车行业发展的一块巨大绊脚石。

912
来自专栏PPV课数据科学社区

【资讯】我们需要更多数据还是精确数据?

不断过滤清理数据,直到确保它的正确性的日子已经逐渐成为奢望,尤其是当IT部门需要以更快的速度和更多的灵活性来响应业务部门的需求时。但是,提供实时数...

29011

扫码关注云+社区

领取腾讯云代金券