这是一个由互联网催生的“杠精”充斥的时代,想必你一定遇到过。
回想一下,你在微博上针对问题提出看法,几小时后发现一队人马@你排队挑衅,他们奉行“只对人不对事”和“以抬杠为己任”的基本原则,试图和你吵架。
前方注意⚠⚠⚠,一大波杠精来袭。
请问客官,预防吵架的特效神器要不要了解一下?
近日,Google旗下的科技孵化器Jigsaw、康奈尔大学和维基媒体基金会合作,联合开发了一个预测谈话走向的AI系统。
这个系统能从一开始就能预测谈话是否会失控,想在对话能被挽救的情况下,尽早预防不必要的争吵,活脱脱一个“吵架预防器”。
在今年ACL大会收录的论文Conversations Gone Awry: Detecting Early Signs of Conversational Failure中,Lucas Dixon和Nithum Thain等人通过分析维基百科中的讨论页面,收集了1207次谈话,当做训练数据。
其中,一半对话最终发展成攻击性言论,另一半数据仍然为礼貌交流。研究人员通过使用Jigsaw的Perspective API识别有害言论,并收集人类标注的标签作为数据集。最终,一组对话的平均长度为4.6条。
至此,数据集☑。
随后,研究人员开始分析这些对话中的关键词有怎样的特征。
他们通过“表示礼貌的语用手段”将对话分类。这是一系列特征,并且与谈话的感情走向一致。无论是对话中包含友好的礼貌用语(比如“谢谢”、“请”等词语),还是表达了希望继续探讨的积极用语(比如“我认为”“我觉得”),它都能识别出来,并依此分类。
然后,研究人员分析了结果和最初的评论,看看他们的系统是否能学会预测将来是否会产生负面评论。
当当当当,杠精预防发生器在一系列努力后终于完工。
研究人员做了一个测试,人类成功预测了大约72%的恶意对话,这个AI系统最终预测准确率达到61.6%。
此外,研究人员还得出了一些统计相关性,可以帮助人类和机器更好地发现那些容易出现攻击评论。“我们粗略发现,言语越直率,遭到个人攻击的可能性越大。”这一效应与我们的直觉一致,即太直接的表达暗示了交谈中潜在的敌意。
为了便于以后的探索,研究人员还将数据和代码整合,作为康奈尔会话分析工具箱的一部分。
对了,关于这个杠精预防发生器的更多说明,可以查看它的原理说明:
https://arxiv.org/abs/1805.05345
康奈尔会话分析工具箱地址:
https://github.com/CornellNLP/Cornell-Conversational-Analysis-Toolkit
对了,文中提到的Perspective API已上线,需要的话自取吧~
https://perspectiveapi.com/#/
虽然有吵架预防器的保护,还是要谨记八字箴言“珍爱生命,远离杠精”呀。