专栏首页arxiv.org 翻译专栏伤害性词语: 量化临床上下文词语嵌入中的偏见(CS CL)
原创

伤害性词语: 量化临床上下文词语嵌入中的偏见(CS CL)

在这项工作中,我们研究了嵌入在多大程度上可能以不同的方式对边缘化人群进行编码,以及这是如何导致偏见的持续存在和临床任务表现的恶化。 我们根据MIMIC-III 医院的数据集,对深度嵌入模型(BERT)进行预先训练,并用两种方法对潜在的差异进行量化。 首先,我们识别危险的潜在关系,所捕获的上下文词嵌入使用填补空白的方法,文字来自真实的临床记录和日志概率偏差评分量化。 第二,我们评估超过50个下游临床预测任务的公平性的不同定义的性能差距,包括急性和慢性疾病的检测。 我们发现从 BERT表征训练出来的分类器在表现上有统计学意义上的显著差异,在性别、语言、种族和保险状况方面往往偏向于大多数人群。 最后,我们探讨了在上下文字嵌入中使用对抗性消偏来模糊子群信息的缺点,并推荐了这种深嵌入模型在临床应用中的最佳实践。

原文题目:Hurtful Words: Quantifying Biases in Clinical Contextual Word Embeddings

原文:In this work, we examine the extent to which embeddings may encode marginalized populations differently, and how this may lead to a perpetuation of biases and worsened performance on clinical tasks. We pretrain deep embedding models (BERT) on medical notes from the MIMIC-III hospital dataset, and quantify potential disparities using two approaches. First, we identify dangerous latent relationships that are captured by the contextual word embeddings using a fill-in-the-blank method with text from real clinical notes and a log probability bias score quantification. Second, we evaluate performance gaps across different definitions of fairness on over 50 downstream clinical prediction tasks that include detection of acute and chronic conditions. We find that classifiers trained from BERT representations exhibit statistically significant differences in performance, often favoring the majority group with regards to gender, language, ethnicity, and insurance status. Finally, we explore shortcomings of using adversarial debiasing to obfuscate subgroup information in contextual word embeddings, and recommend best practices for such deep embedding models in clinical settings.

原文作者: Amy X. Lu

原文地址:https://arxiv.org/abs/2003.11515

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数学真理的爆炸性证明(CS SC)

    数学证明既是确定性的典范,也是我们在文化记录中所拥有的一些最明确的合理论据。然而,它们非常明确,导致了一个悖论,因为它们的错误概率随着论据的扩展呈指数增长。在这...

    用户7095611
  • 标度指数与标准差比关系的推导(CS LG)

    异速生长规律是理解城市演化的基本规律之一。这个定律的一般形式是异速缩放定律。然而,标度指数的深层含义和基本原理仍有待揭示。本文运用线性代数和回归分析理论,揭示了...

    用户7095611
  • 识别在公共交通系统中传播疾病的有传染性的旅行者(CS SI)

    最近一种新型冠状病毒的爆发及其迅速传播突出了了解人类流动性的重要性。 密闭空间,例如公共交通工具(例如巴士及火车) ,提供适当的环境让感染迅速广泛传播。因此,调...

    用户7095611
  • 在存在累计前景博弈者的博弈论下的黑盒策略与平衡(cs.GT)

    偏好关系的中间属性规定了两个彩票的可能性混合应该在这两个彩票的偏好之间。它是独立属性的一种弱化形式,并且因此满足于期望效应理论(EUT)。实验中对于中间属性的违...

    Donuts_choco
  • A Theory of State Abstraction for Reinforcement Learning

    A Theory of State Abstraction for Reinforcement Learning

    用户1908973
  • How Web App Development Process is Becoming More Efficient?

    The software development industry is extremely competitive these days, the clien...

    用户4822892
  • 从本体感知到新型环境中的长距离规划:分层RL模型(CS AI)

    为了使智能代理能够在复杂环境中灵活高效地进行操作,它们必须能够在时间,空间和概念抽象的多个级别进行推理。在较低级别,代理必须解释其本体感受输入并控制其肌肉,而在...

    刘子蔚
  • 深层神经网络输入输出层在对抗性防御中的作用探讨(CS LG)

    深层神经网络是一种在前景预测、计算机视觉、语言处理等领域都取得了最新成果的学习模型,然而,已有研究表明,存在某些特定输入不会误导人类,但可能会完全误导模型,这些...

    Elva
  • 研究用于社交媒体中仇恨语音检测的深度学习方法(CS CL)

    互联网的迅猛发展有助于增强个人的表达能力,但滥用表达自由的行为也导致各种网络犯罪和反社会活动的增加。仇恨言论就是一个这样的问题,需要非常认真地解决,否则,这可能...

    刘子蔚
  • 避免护理机器人对痴呆症患者的不当治疗(CS RO)

    “最残忍和最令人发指的罪行”一词被用来描述历史上那些本应有责任保护和帮助患者的人,对脆弱的患者实施的一些不良护理。我们相信历史在不断重演,因为越来越多像人类一样...

    奥斯特洛夫斯萌

扫码关注云+社区

领取腾讯云代金券