前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >知识图谱完整项目实战(附源码)(3)

知识图谱完整项目实战(附源码)(3)

作者头像
数据饕餮
发布2019-01-14 16:42:27
2.1K0
发布2019-01-14 16:42:27
举报
文章被收录于专栏:数据饕餮数据饕餮

一、前言

本文是《知识图谱完整项目实战(附源码)》系列博文的第3篇:汽车知识图谱系统架构设计,主要介绍汽车领域知识图谱系统的总体架构设计和关键技术。

知识图谱的学习是一个基础到实战,从入门到精通的一个逐渐深入的、渐进式的过程。在这个过程中,一个完整的项目,起到的作用往往是对过往所学全部知识的串联和融合。只有经过一个完整项目的实践,才能真正把所学的、离散的、点状的知识点融合到一起,从而形成理论到实战的转变。基于这样的一个原因考虑,结合自身工程实践的过程,才有了这样一个课程,希望能够对渴望知识图谱能力进阶的人有所裨益。

二、正文

2.1 汽车知识图谱总体设计

汽车知识图谱的系统架构可以划分为五个层次:数据源、ETL知识抽取层、数据模型层、业务逻辑层、知识应用层。这里面层次的划分其实是在参考传统的数据系统建设的思路。

2.2 汽车知识图谱关键技术

知识图谱的关键技术可以从知识的来源进行区分,包括知识获取对应网络爬虫,ETL工具;知识存储对应图数据库;知识图谱可视化对应数据可视化分析工具等。

2.2.1 图数据库

Neo4j是图数据库领域的王者,连续多年在DB排行中处于第一,具有成熟的文档和稳定的系统,同时包括开源版本和企业版本,是构建知识图谱的首选。

Apache Jena是RDF和OWL的开发框架,同时提供了Fusike和TDB的数据访问和存储支持,是基于本体建模的最佳选择。

2.2.2 Python爬虫

python爬虫框架中,最为成熟和完整的框架是scrapy,目前为止是基于pyton构建网络爬虫的最佳选择。其工作流程和运行机制如下图所示:

三、未完待续

本文是《知识图谱完整项目实战(附源码)》系列博文的第3篇:汽车知识图谱系统架构设计,主要介绍汽车领域知识图谱系统的总体架构设计和关键技术。配套视频内容已同步发布在CSDN学院《知识图谱完整项目实战(附源码)》,敬请关注。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年12月04日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档