首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何构建知识图谱?

如何构建知识图谱?
EN

Stack Overflow用户
提问于 2015-04-06 03:02:37
回答 2查看 11.3K关注 0票数 16

我用pagerank制作了一个可以在我的电脑上运行的小型搜索引擎的原型。我感兴趣的是在它上面建立一个知识图谱,它应该只返回正确上下文中的查询网页,类似于Google如何找到搜索问题的相关答案。我看到了很多关于知识图谱的宣传,但没有太多的文献,几乎没有构建知识图谱的指导方针的伪代码。有没有人知道这样的知识图谱在内部是如何工作的,这样就不需要创建关于知识图谱的模型了?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2015-04-06 05:36:43

知识图谱是一个时髦的词。它是将模型和技术放在一起以实现结果的总和。你旅程的第一站从Natural language processingOntologiesText mining开始。它是人工智能的一个广泛的领域,去here上对该领域进行研究调查。

在构建自己的模型之前,我建议您使用gensim等专用工具箱尝试不同的标准算法。您将了解tf-idf、LDA、文档特征向量等。

我假设你想要处理文本数据,如果你想用其他图像进行图像搜索,那就不一样了。音频部分也是如此。

建立模型只是第一步,谷歌知识图谱中最困难的部分是实际扩展到每天数十亿次请求……

一个好的处理流水线可以“轻松”地建立在Apache Spark之上,“当前的Hadoop”。它提供了一个弹性的分布式数据存储,如果您想要扩展,这是必需的。

如果你想像图论(如pagerank)那样将数据保存为图,用于实时查询,我建议你使用Bulbs,这是一个框架,它“就像一个用于图的对象模型,但你使用图遍历语言Gremlin来查询数据库”。例如,您可以将后端从Neo4j切换到OpenRDF (在进行本体时很有用)。

对于图形分析,您可以使用Spark、GraphX模块或GraphLab

希望能有所帮助。

票数 36
EN

Stack Overflow用户

发布于 2021-12-17 20:38:59

我知道我来晚了,但首先要澄清一些术语: Knowledge Graph和Ontology是相似的(我说的是语义Web范式)。在语义web堆栈中,基础是RDF,这是一种将图形定义为三元组(主语、谓语、宾语)的语言。RDFS是RDF之上的一层。它定义了一个元模型,例如,诸如rdf:type之类的谓词和诸如rdfs:Class之类的节点。虽然RDFS提供了一个元模型,但它没有逻辑基础,因此没有推理者可以验证该模型或对其进行进一步的推理。RDFS的顶层是OWL (Web Ontology Language)。它具有由描述逻辑定义的形式语义,描述逻辑是一阶逻辑的可判定子集。它具有更多预定义的节点和链接,如owl:Class、owl:ObjectProperty等。因此,当人们使用术语本体时,他们通常指的是OWL模型。当他们使用术语Knowledge Graph时,它可能指的是在OWL中定义的本体(因为OWL最终仍然是一个RDF图),或者它可能只表示RDF/RDFS中的一个图。

我说,因为IMO,构建知识图谱的最好方法是定义本体,然后使用各种语义web工具将数据(例如,从电子表格)加载到本体中。开始使用IMO的最好工具是Protege ontology editor from Stanford。它是免费的,而且是一个免费的开源工具,非常可靠和直观。还有一个很好的教程,介绍如何使用Protege和学习OWL以及其他语义Web工具,如SPARQL和SHACL。该教程可以在这里找到:New Protege Pizza Tutorial (披露:链接到我的网站,我写的教程)。如果你想进入图的较低层,你可能想看看三元组。它是为OWL和RDF模型设计的图形数据库。Franz Inc's AllegroGraph triplestore的免费版本很容易使用,并且支持500万个三元组。另一个很好的三元库是免费和开源的,它是Apache Jena framework的一部分。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/29461062

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档