专栏首页arxiv.org翻译专栏研究用于社交媒体中仇恨语音检测的深度学习方法(CS CL)
原创

研究用于社交媒体中仇恨语音检测的深度学习方法(CS CL)

互联网的迅猛发展有助于增强个人的表达能力,但滥用表达自由的行为也导致各种网络犯罪和反社会活动的增加。仇恨言论就是一个这样的问题,需要非常认真地解决,否则,这可能对社交组织的完整性构成威胁。

在本文中,我们提出了利用各种嵌入的深度学习方法来检测社交媒体中各种类型的仇恨言论。从大量文本(尤其是包含有限上下文信息的tweet)中检测仇恨语音也带来了一些实际挑战。

此外,用户生成的数据种类繁多,并且存在各种形式的仇恨言论,这使得确定消息的程度和意图变得非常具有挑战性。我们在三个不同领域的公开数据集上进行的实验表明,准确性和F1得分均有显着提高。

原文标题:Investigating Deep Learning Approaches for Hate Speech Detection in Social Media

原文:The phenomenal growth on the internet has helped in empowering individual's expressions, but the misuse of freedom of expression has also led to the increase of various cyber crimes and anti-social activities. Hate speech is one such issue that needs to be addressed very seriously as otherwise, this could pose threats to the integrity of the social fabrics.

In this paper, we proposed deep learning approaches utilizing various embeddings for detecting various types of hate speeches in social media. Detecting hate speech from a large volume of text, especially tweets which contains limited contextual information also poses several practical challenges.

Moreover, the varieties in user-generated data and the presence of various forms of hate speech makes it very challenging to identify the degree and intention of the message. Our experiments on three publicly available datasets of different domains shows a significant improvement in accuracy and F1-score.

原文作者:Prashant Kapil, Asif Ekbal, Dipankar Das

原文地址:https://arxiv.org/abs/2005.14690

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 从本体感知到新型环境中的长距离规划:分层RL模型(CS AI)

    为了使智能代理能够在复杂环境中灵活高效地进行操作,它们必须能够在时间,空间和概念抽象的多个级别进行推理。在较低级别,代理必须解释其本体感受输入并控制其肌肉,而在...

    刘子蔚
  • 在法庭上的表演:法国上诉法院判决的自动处理和可视化(CS AI)

    人工智能技术在法律领域已经很流行并且很重要。我们从司法判决中提取法律指标,以减少法律系统信息的不对称性和诉诸司法的机会。我们使用NLP方法从判决中提取有趣的实体...

    刘子蔚
  • 具有参数化数据的Petri网:建模和验证(扩展版)(CS AI)

    在过去的十年中,已经提出了各种方法来将业务流程与不同类型的数据集成在一起。每种方法都反映了整个过程数据集成范围内的特定需求。一个特别重要的一点是,这些方法能够灵...

    刘子蔚
  • 原创译文 | 区块链不仅仅是技术,而是新的经济体系

    转载声明 本文为灯塔大数据原创内容,欢迎个人转载至朋友圈,其他机构转载请在文章开头标注:“转自:灯塔大数据;微信:DTbigdata” 导读:上一期了解了关于将...

    灯塔大数据
  • 2017美国数学建模MCM C题(大数据)翻译 “合作和导航”

    Traffic capacity is limited in many regions of the United States due to the numb...

    AI那点小事
  • 【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

    【导读】专知内容组整理了最近五篇视觉图像分割(Image Segmentation)相关文章,为大家进行介绍,欢迎查看! 1. Conditional Rand...

    WZEARW
  • 利用动态纹理分析法对视频序列假脸进行检测(CS)

    在过去的几年中,涉及人物角色的可控多媒体内容的达到了空前的逼真度。为了在图像和视频中显示出合成的人脸,需要使用到自动化相关技术。本研究以表征和区分真序列和伪序列...

    Pamela_Lin
  • 随机供应和灵活消费者的最优动态机制设计(CS GT)

    我们考虑的问题是设计一个预期收益最大化机制,在T个时间步长内将k个品种的多个非易腐商品分配给灵活的消费者。在我们的模型中,每个品种的随机数量的商品在每个时间都可...

    Rosalie
  • 有界CTL的充要条件(CS AI)

    计算树逻辑(CTL)是形式验证中的主要形式主义之一。作为一种规范语言,它用于表示预期现有系统可以满足的属性。从验证和系统设计的角度来看,由于各种原因,这种特性的...

    RockNPeng
  • 《风格的要素》中的编程格言

    之所以翻译这篇文章,因为它与我之前关于如何/为什么要写出更易懂的代码的思考有很多关联,但更进一步的是,这篇文章直接指出了写作与编程在原则上的相似性,本质上他们都...

    ThoughtWorks

扫码关注云+社区

领取腾讯云代金券