首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    以毒攻毒:愚人节恶搞文章可以用来识别假新闻!

    4 月 1 日至少有一个好处,你可以撒点谎而不必担心友尽。开玩笑啦!愚人节的真正好处是,提供了很多素材帮助语言学家识别「假新闻」。 英国兰卡斯特大学计算机和通信学院博士生 Edward Dearden 及其导师 Dr. Alistair Baron 就提出了一种建设性方法:利用愚人节那天网络上的假消息来研究欺骗性的语言,借此找出方法来识别「假新闻」。 他们发现,幽默的愚人节恶作剧——媒体每年4月1日发表的恶搞文章和恶意假新闻在写作结构上具有相似性。 研究者编译了一个新的数据集,或者说语料库,里面包含14年间的500多篇愚人节恶搞新闻。这些新闻来自370多个网站。 「愚人节恶搞文章非常有用,因为它们提供了很多可证实的欺骗性文本,让我们有机会发现写作者写作以假乱真的假新闻时所使用的语言学技巧。通过查看愚人节恶搞文章的语言并将它们和假新闻对比,我们能够更好地理解假新闻写作者使用的语言。」Edward 表示。 将愚人节恶搞文章和同时期写就但未在愚人节当天发表的真实新闻进行对比,我们会发现文体上的差异。 研究者集中于文本中的特定特征,例如使用的细节数量、模糊度、写作风格的正式性和语言的复杂度。 然后他们将愚人节消息和之前由另一组研究人员编译的「假新闻」数据集(参见《This Just In: Fake News Packs a Lot in Title, Uses Simpler, Repetitive Content in Text Body, More Similar to Satire than Real News》)进行了对比。 虽然从愚人节恶搞文章中发现的特征并非都对检测假新闻有用,但两者有很多相似的特征。 研究者发现相比真实新闻,愚人节恶搞文章和假新闻的语言复杂度都偏低,阅读难度也更低,而且句子更长。 研究发现,愚人节恶搞文章较少使用新闻报道中的重要细节,如名称、地点、日期、时间等。但是,假新闻比真实新闻更多地使用专有名词,如著名政治人物的名字:「特朗普」或「希拉里」等,而愚人节恶搞新闻使用的专有名词则较少。 第一人称代词(如「we」)也是愚人节恶搞文章和假新闻的重要特征。这与大家对欺骗检测的传统认知相反,传统观点认为说谎者更少使用第一人称代词。研究者发现愚人节恶搞文章与真实新闻相比,具有以下特点:

    02

    C++是不是一门设计糟糕的语言?

    从事软件开发多年,经常使用的编程语言有C语言和C++,使用的次数多了做的项目多了之后,最多的感觉是编程语言其实就是工具存在,不同的编程语言在不同的场景有不同的用处,没有所谓的最佳编程语言只是使用的场景不一样而已,现在全球的编程语言种类有500多种,真正在主战场上的有十几种,而且头部的编程语言经常在变换,主要的原因在于科技在变化适应当前形势的编程语言必然发生变化,在十几年前主流的编程语言是C语言和C++,现在已经被java,php,python等编程语言占领,但要说C语言和C++过时了显然也是不合理的,因为随着产业规模的提升,单纯从绝对数量上衡量参与人员还是远大于以前。

    02

    作为程序员,你觉得C/C++、Java哪门编程语言更强大?

    作为一个C/C++ java都做过项目的老码农,编程语言没有谁强大谁弱小这么一讲,每种编程都有其自身发挥的优势,在软件发展早期阶段C/C++重要性会更高一点,毕竟那个阶段硬件性能还跟不上,在有些板卡上为了提升性能C语言是首选,C++都会考虑下是不是影响整体性能,C/C++是名副其实的编程语言的统治者,后来随着科技的进步,主要是硬件的发展,硬件的性能越来越强,在板卡上运行java程序都不觉得卡段的时代来临,最主要是随着软件这些年的发展,很多基础领域的事情已经完善,在很多类库或者板块上都已经有了成熟的方案,所以促进了各种应用级的开发,能够快速开发应用高级语言相比C/C++就有了非常大的优势了。

    02
    领券