【neo4j图数据库】基础入门&案例整理

neo4j有社区版本和企业版。社区版本是免费的,只支持单机版;企业版是付费的,是分布式的。整理了一些不错的参考资料分享给大家。

  • neo4j官网:https://neo4j.com/

Cypher是类似SQL的查询语言,支持做基础的图挖掘项目,属于轻量级。腾讯的QQ、微信社交关系挖掘,是基于spark的Graphx做计算引擎,Hbase来存储关系链。

  • Cypher官网:https://neo4j.com/developer/cypher/

neo4j可以做推荐引擎、基于图的搜索、社交关系挖掘等,具体可以参考官网的介绍,neo4j+storm可以做实时的图挖掘,欺诈监测等;neo4j+spark,spark做关系链的抽取、数据的ETL,然后存储到neo4j,可以做进一步的图挖掘。

  • Youtube 视频案例

https://www.youtube.com/watch?v=bp1NmA4rZuI&spfreload=10 (storm neo4j python )

  • 应用案例

http://www.cnblogs.com/starcrm/p/5033117.html(中文版本SNS关系应用)

https://neo4j.com/graphgist/9d627127-003b-411a-b3ce-f8d3970c2afa(银行欺诈监测)

https://neo4j.com/graphgist/122cdc26-ee79-4d30-ab17-540eb5218a5f(信用卡欺诈监测)

https://neo4j.com/graphgist/a7c915c8-a3d6-43b9-8127-1836fecc6e2f(电影推荐,基于KNN和余弦相似)

https://neo4j.com/graphgist/09bb2bbc-fb73-47a8-9778-3e5f22dcd27c(维基百科,图搜索)

https://maxdemarzi.com/2012/02/16/importing-wikipedia-into-neo4j-with-graphipedia/ (维基百科的数据导入neo4j并提取关系链)

https://neo4j.com/graphgist/a00811bb-aa5f-4b1f-a480-248c7104db96(法国巡回赛数据分析)

  • neo4j数据的批量导入

https://www.youtube.com/watch?v=IRTgsxL9V8g (mysql 到 neo4j)

https://www.youtube.com/watch?v=dCM7fRb49Ts (自定义数据格式导入)

https://www.youtube.com/watch?v=dCM7fRb49Ts(传统的关系数据库到neo4j)

https://github.com/lycofron/pysql2neo4j(Migrate an SQL db to Νeo4j graph db) python版本

https://github.com/jexp/neo4j-rdbms-import(关系数据库数据的批量导入

以上是一些基础参考资料,实际业务使用neo4j需要评估性能、关系链的更新操作,neo4j导入数据需要关闭数据库实例、做离线数据挖掘可以尝试。

原文发布于微信公众号 - 深度学习与数据挖掘实战(www_datageekers_com)

原文发表时间:2016-08-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏华章科技

如何打造高性能大数据分析平台

大数据分析系统作为一个关键性的系统在各个公司迅速崛起,但是这种海量规模的数据带来了前所未有的性能挑战。同时,如果大数据分析系统无法在第一时间为运营决策提供关键数...

1125
来自专栏携程技术中心

干货 | 携程酒店360度Java质量控制

作者简介 王幸福,携程酒店研发部资深测试开发工程师,负责酒店测试框架和测试工具的研发。技术狂热者,热衷于开源项目,利用创新去提高测试工作的效率。 一、前言 携程...

3454
来自专栏jmeter高手高高手

<转>性能测试浅谈

本文主要针对WEB系统的性能测试。不涉及具体的执行操作,只是本人对性能测试的一点理解和认识。

1394
来自专栏Web行业观察

老王:我想成为公司的主力架构师

要想成为软件开发的专家,需要我们完整了解软件开发的流程,并在关键部分掌握丰富经验。

480
来自专栏屈定‘s Blog

如何学习一门新技术

最简单的是找一个上手视频,因为视频是非常直观的展示了技术的使用.先学会用是最根本的,对于没有视频的技术的话,就可以搜索XX上手教程,XX学习记录之类的关键词,很...

1963
来自专栏云计算D1net

如何防止云计算迁移的回旋效应

最近的调查研究表明,多达50%的企业表示希望将业务从云计算迁移回数据中心,虽然这种回旋效应有很多原因,但缺乏数据一致性是最主要的原因之一。 ? 最近的调查研究表...

3425
来自专栏企鹅号快讯

2018微服务狂热之死

微服务在过去几年成为一个非常受欢迎的话题。 “微服务狂热”就像这样: Netflix在devops上非常棒。 Netfix做微服务。 所以:如果我做微服务,我也...

2098
来自专栏斑斓

系统架构 | 软件架构的一致性

在Brooks的力作《设计原本(The Design of Design)》一书中,提及“一致性”对软件的重要性。他认为:“一致性应该是所有质量原则的根基。好的...

4277
来自专栏灯塔大数据

如何打造高性能大数据分析平台

大数据分析系统作为一个关键性的系统在各个公司迅速崛起,但是这种海量规模的数据带来了前所未有的性能挑战。同时,如果大数据分析系统无法在第一时间为运营决策提供关键数...

3619
来自专栏大数据和云计算技术

大数据和云计算技术周报(第59期)

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

1202

扫码关注云+社区