专栏首页arxiv.org翻译专栏知识图谱中什么是正常的什么是奇怪的以及缺少什么(CS AI)
原创

知识图谱中什么是正常的什么是奇怪的以及缺少什么(CS AI)

知识图谱(KGs)在图谱的结构中存储了关于世界的高度异构的信息,对于回答问题和推理等任务非常有用。然而,它们经常包含错误和丢失信息。知识图谱精准化的活跃研究已经解决了这些问题,裁剪技术可以检测特定类型的错误,也可以完成知识图谱。

在这项工作中,我们引入一个统一的解决方案表征通过制定无监督的问题关于知识图谱与一系列的归纳总结,软规则,其说明在知识图谱中是正常的,因此可以用来识别异常,无论是错误或失踪。与一阶逻辑规则不同,我们的规则被标记为有根图,即根据节点的类型和知识图谱中的信息,描述一个(可见或不可见的)节点周围的预期邻域的模式。离开传统的支持/在意规则挖掘技术,我们建议知识图谱学家将知识图归纳总结,学会总结归纳规则,最好压缩公斤根据最小描述长度原则————制定我们的上下文中首先使用知识图谱规则挖掘。我们将规则应用于三个大型知识图谱(NELL、DBpedia和Yago),以及诸如压缩、各种类型的错误检测和不完整信息标识等任务。我们证明了知识图谱学习在错误检测和不完全性识别(识别93%缺失实体的位置—比基线多10%)方面优于特定于任务的、有监督的和无监督的基线,同时对于大型知识图谱也是有效的。

原文标题:What is Normal, What is Strange, and What is Missing in a Knowledge Graph: Unified Characterization via Inductive Summarization

原文:Knowledge graphs (KGs) store highly heterogeneous information about the world in the structure of a graph, and are useful for tasks such as question answering and reasoning. However, they often contain errors and are missing information. Vibrant research in KG refinement has worked to resolve these issues, tailoring techniques to either detect specific types of errors or complete a KG. In this work, we introduce a unified solution to KG characterization by formulating the problem as unsupervised KG summarization with a set of inductive, soft rules, which describe what is normal in a KG, and thus can be used to identify what is abnormal, whether it be strange or missing. Unlike first-order logic rules, our rules are labeled, rooted graphs, i.e., patterns that describe the expected neighborhood around a (seen or unseen) node, based on its type, and information in the KG. Stepping away from the traditional support/confidence-based rule mining techniques, we propose KGist, Knowledge Graph Inductive SummarizaTion, which learns a summary of inductive rules that best compress the KG according to the Minimum Description Length principle---a formulation that we are the first to use in the context of KG rule mining. We apply our rules to three large KGs (NELL, DBpedia, and Yago), and tasks such as compression, various types of error detection, and identification of incomplete information. We show that KGist outperforms task-specific, supervised and unsupervised baselines in error detection and incompleteness identification, (identifying the location of up to 93% of missing entities---over 10% more than baselines), while also being efficient for large knowledge graphs.

原文作者:Caleb Belth, Xinyi Zheng, Jilles Vreeken, Danai Koutra

链接:https://arxiv.org/abs/2003.10412

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 柏拉图对话系统:一个灵活的人工智能会话研究平台(cs AI)

    随着语音对话系统和会话人工智能领域的发展,对工具和环境的需求也在增长,这些工具和环境可以抽象出实现细节,从而加快开发过程,降低进入该领域的门槛,并为新思想提供一...

    RockNPeng
  • 有界CTL的充要条件(CS AI)

    计算树逻辑(CTL)是形式验证中的主要形式主义之一。作为一种规范语言,它用于表示预期现有系统可以满足的属性。从验证和系统设计的角度来看,由于各种原因,这种特性的...

    RockNPeng
  • 产生混合神经符号模型的新概念(CS AI)

    人类的概念知识是支持生成新颖而高度结构化的概念的能力,而这种概念知识的形式引起了认知科学家的极大兴趣。一种传统强调结构化知识,将概念视为嵌入直观理论中或组织为复...

    RockNPeng
  • 【论文推荐】最新七篇知识图谱相关论文—知识表示学习、增强神经网络、链接预测、关系预测与提取、综述、递归特性生成、深度知识感知网络

    【导读】专知内容组整理了最近七篇知识图谱(Knowledge graphs)相关文章,为大家进行介绍,欢迎查看! 1. Does William Shakesp...

    WZEARW
  • 如何测试深度学习

    One of thelargest challenges when starting our company was learning how to use d...

    小老鼠
  • 汽车黑客手册-简介

    在2014年,Open Garages(汽车黑客社区,一群在汽车安全方面乐于分享合作的人)发布了第一本《汽车黑客指南》作为汽车黑客课程的教材。这本书的设计初衷是...

    vell001
  • 未来创新的人工智能测试自动化工具:第三次浪潮

    当我回顾我在测试自动化领域的职业生涯时,有三个不同的时期,或者说“波浪”会浮现在我的脑海中。

    小老鼠
  • 形状变换在地震、风浪数据时间序列分类中的应用(CS LG)

    由于对大量工程结构(包括建筑物、桥梁、塔楼和海上平台等)的长期健康监测,使用时间序列分类法从大型数据库中自主检测所需事件,在土木工程中越来越重要。在这种情况下,...

    刘持诚
  • How to Improve Your Programming Skills?

    How-to-Improve-your-Programming-skills.png

    用户4822892
  • 【论文推荐】最新七篇知识图谱相关论文—嵌入式知识、Zero-shot识别、知识图谱嵌入、网络库、变分推理、解释、弱监督

    【导读】专知内容组整理了最近七篇知识图谱(Knowledge graphs)相关文章,为大家进行介绍,欢迎查看! 1.Learning over Knowled...

    WZEARW

扫码关注云+社区

领取腾讯云代金券