前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >知识图谱上简单问题的知识问答

知识图谱上简单问题的知识问答

作者头像
Steve Wang
发布2019-10-22 15:00:29
6990
发布2019-10-22 15:00:29
举报
文章被收录于专栏:从流域到海域从流域到海域

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/Solo95/article/details/102599726

简单问题的界定是能通过查找一个事实就可以解答。本文关注baseline方法,是一篇概述博客。 本文介绍的方法属于pipeline风格,即分解问题到几个阶段,分阶段用对应的模块解决,最后的模块输出最后的结果。最新的研究进展也有构建知识图谱,然后在图上跑强化学习方法来进行解答路径选择。

知识图谱上的简单问题知识问答

在这里插入图片描述
在这里插入图片描述

该问题可以直接分解为实体检测(entity detection)关系链接(entity linking)关系预测(relation prediction)证据整合(evidence integration) 四个阶段。

有一个相关数据集:SIMPLEQUESTIONS

实体检测(entity detection)

给定一个问题,实体检测的目标是识别被查询的实体。这很自然的就是一个序列标注问题,对每一个标识符(token),分配ENTITY或者NOTENTITY两个标签中的一个。

序列标注问题很明显能使用RNN来做。RNN这里不再赘述,可以参考之前的博文。

在RNN出现之前使用的方法是Conditional Random Fields(CRFs),是当时的state-of-art。

实体链接(entity linking)

实体检测的输出是一系列代表候选实体的标识符,需要把它们链接起来以构成一个知识图谱。Freebase中将每一个节点使用一个机器标识符(MID, Machine Identifier)。除此之外,可以简单的当作一个模糊字符匹配来处理。

关系预测(Relation Prediction)

关系预测的目标是识别被查询的关系。

可以被看做是整个问题上的分类问题。可以使用RNN、CNN、LR等分类器来进行。

证据整合(Evidence Integration)

在由前述3个步骤给定mmm个实体,rrr个关系之后,最终任务是整合所有的证据抵达作为最终结果的一个(entity,relation)(entity,relation)(entity,relation)预测。

可以通过以下方法来做:

首先生成m∗rm*rm∗r个(entity,relation)(entity, relation)(entity,relation)元组,使用前述组件的得分(scores)相乘得到每一个元组的得分,因为前述三个步骤是独立进行的,所以很多组合会是没有意义上的(例:在知识图谱中没有对应的关系存在),把这些无意义的组合剪去。剪去之后你会发现得分交叉(scoring ties),因为知识图谱上有重名结点。可以简单的通过选取入边最多的结点作为一个简单的代理结点(proxy)来打破交叉。进一步的,还可以选取有映射到维基百科的实体,这些实体出现在维基百科上,说明他们是流行的,或者说人们所关注的。

参考文献

Strong Baselines for Simple Question Answering over Knowledge Graphs with and without Neural Networks. Salman Mohammed, Peng Shi, and Jimmy Lin, NAACL-HLT (2) 2018: 291-296.

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019-10-17 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 知识图谱上的简单问题知识问答
    • 实体检测(entity detection)
      • 实体链接(entity linking)
        • 关系预测(Relation Prediction)
        • 证据整合(Evidence Integration)
        • 参考文献
        相关产品与服务
        灰盒安全测试
        腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档