前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于本体体系的知识图谱构建

基于本体体系的知识图谱构建

作者头像
UM_CC
发布2022-09-22 14:53:34
1K0
发布2022-09-22 14:53:34
举报

数据获取

  • 基于自然语言处理技术的实体抽取(中文命名实体识别平台如TLP、HanLP等均提供了不错的接口),当然也可以根据项目需求采用传统的机器学习或深度学习模型进行抽取、特定领域的新词发现等(难度较高、而且不完全适用,依领域而定)
  • 人工非结构化数据抽取(众包标注平台)、人工辅助修正
  • 以构造的实体为出发点在相关的平台爬虫爬取结构化数据作为补充,可重复迭代
  • 人工非结构化数据抽取
  • 其他团队已有的研究成果、数据库数据(本体对齐)

本体建模

  • 基于protege开源工具(https://protege.stanford.edu/)手工构建本体,依托于protege可以搭建一个支持多人协作的online版的大型本体构建平台
  • protege的底层是对owl文件的增删改查,依托于owl的本体框架规范,可自行构建对owl本体文件的操作脚本,以实现海量结构化数据的增删改查,提高效率

本体工具

  • Jena:对于本体文件的接口框架,用于构建系统后端
  • TDB:Jena内置的用于存储RDF的组件
  • Jena提供了RDFS、OWL和通用规则推理机(http://jena.apache.org/download/index.cgi),除此之外,可以嵌入主流的对比效果更好的推理机
  • SPARQL:(SPARQL Protocol and RDF Query Language),是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。可以大幅度地提高本体信息的检索速度
  • Fuseki:Jena提供的SPARQL服务器,也就是SPARQL endpoint(http://central.maven.org/maven2/org/apache/jena/apache-jena-fuseki/3.8.0/

后台搭建

  • 基于java的后台框架Springboot,SSM等
  • 利用Jena进行本体数据处理,采用SPARQL作为检索语言

前端

  • 基于Html、css、js的框架React、Vue等,设计时可考虑移动端的兼容问题
  • 多样的可视化手段来展示信息,利用echart.js实现知识图谱可视化

知识问答

Related Posts

  • Apache Jena Fuseki使用Apache Jena Fuseki是一个SPARQL服务,其可以作为操作系统服务、Java网络应用…
  • 知识图谱学习资料汇总知识图谱最开始是Google为了优化搜索引擎提出来的,推出之后引起了业界轰动,随后其他搜索公司也纷纷…
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021-05-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据获取
  • 本体建模
  • 本体工具
  • 后台搭建
  • 前端
  • 知识问答
    • Related Posts
    相关产品与服务
    灰盒安全测试
    腾讯知识图谱(Tencent Knowledge Graph,TKG)是一个集成图数据库、图计算引擎和图可视化分析的一站式平台。支持抽取和融合异构数据,支持千亿级节点关系的存储和计算,支持规则匹配、机器学习、图嵌入等图数据挖掘算法,拥有丰富的图数据渲染和展现的可视化方案。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档