一个很好的选择就是三元组:
RDF是知识图谱的一种常见表示形式,以(subject, predicate, object)的三元组形式就足以表示实体之间的许多复杂联系。...如:
[‘清政府’, ‘签订’, ‘天津条约’]
[‘袁世凯’, ‘复辟’, ‘帝制’]
[‘孙中山’, ‘就任’, ‘临时大总统’]
下图是从《中国近现代史纲要》的部分文本中提取的知识图谱的示意图。...问句可以看做残缺的三元组,提问的部分就是三元组中缺失的部分。问句中有些部分的具体内容在已经包含,可以作为已知条件。...而有些部分未知,是作为“谁”,“什么”这样的问词形式存在的,这些部分就替换为查询变量。
例如:"清政府干了些什么?"可以看成(清政府,?x,?y)的三元组。
答案是什么?...y
}
这句话能够查找所有首元素为“清政府”的三元组,并提取出其中的后两个元素。结果大致是[("签订","天津条约"), ("兴办","洋务"),...]
上一个问句主语已知,需要查询谓词和宾语。