分布式图数据库JanusGraph-简介

JanusGraph设计的目的是处理大图,单机无论是在存储和计算能力上都无法满足大图处理。大规模图实时计算和分析是JanusGraph最基本的优势。本节将讨论更多JanusGraph特有的优势以及它底层支持的存储方案。

转自:JanusGraph中文翻译文档

1.1. JanusGraph 基本优势

(1)支持非常大的图。JanusGraph通过添加机器横向扩展集群。

(2)支持很大的并发事务处理和图操作处理。通过添加机器横向扩展JanusGraph的事务处理能力,可以在毫秒级别相应大图的复杂查询。

(3)支持使用Hadoop框架进行全局图分析和批量图处理。

(4)支持在很大的图上对顶点和边进行地理位置、数值范围、全文搜索。

(5)原生支持Apache TinkerPop 描述的当前流行的属性图数据模型。

(6)原生支持图遍历语言Gremlin。

(7)通过使用非编程的方式连接很容易与Gremlin Server集成

(8)提供了很多图级别配置选项用于调节性能。

(9)以顶点为中心的索引提供顶点级查询,以缓解臭名昭着的超级节点问题。

(10)提供优化的磁盘表示,从而允许有效地使用存储和访问速度。

(11)基于 Apache 2 许可协议开放源码。

1.2. JanusGraph 使用 Apache Cassandra的优势

(1)连续可用,没有单点故障。

(2)由于没有主/从架构,因此对图的读/写没有瓶颈。

(3)弹性可扩展性允许加入和移除机器。

(4)缓存层确保内存中多次连续访问的数据可用。

(5)通过添加集群的机器来增加缓存的大小。

(6)可以与 Apache Hadoop集成。

(7)基于 Apache 2 许可协议开放源码。

1.3. JanusGraph 使用 HBase的优势

(1)与Apache Hadoop生态系统紧密集成。

(2)原生支持强一致性。

(3)通过添加更多机器进行线性扩展。

(4)严格的一致性读写操作。

(5)方便的基类用于支持Hadoop MapReduce作业操作HBase表。

(6)支持使用JMX导出监控指标。

(7)基于 Apache 2 许可协议开放源码。

1.4. JanusGraph 和 CAP 理论

尽管你付出了最大的努力,你的系统仍会遇到很多的错误,以至于必须在减少输出(如:停止响应请求)和降低收获(如:响应不完整的答案)之间做出选择。 此决定应基于业务要求。

-- Coda Hale

使用数据库时,应充分考虑CAP定理(C =一致性,A =可用性,P =可分区性)。 JanusGraph发布包中支持3个后端:Apache Cassandra,Apache HBase和Oracle Berkeley DB Java 企业版。 请注意,BerkeleyDB JE是一个非分布式数据库,通常仅与JanusGraph一起用于测试和探索。

HBase以输出为代价优先考虑一致性,即完成请求的概率。 Cassandra以收获为代价优先考虑可用性,即响应的完整性(数据可用性/完整数据)。

原文链接:https://docs.janusgraph.org/latest/index.html

原文作者:janusGraph官方文档

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT技术精选文摘

高并发大容量NoSQL解决方案探索

17630
来自专栏Youngxj

QQ综合工具箱-AD盒子

19740
来自专栏祝威廉

利用Spark Streaming实现分布式采集系统

而Spark Streaming 在上层概念上,完美融合了批量计算和流式计算,让他们你中有我,我中有你,这种设计使得Spark Streaming 作为流式计算...

14130
来自专栏信安之路

Red Team 工具集之信息收集

上图是一个 Red Team 攻击的生命周期,整个生命周期包括:信息收集、攻击尝试获得权限、持久性控制、权限提升、网络信息收集、横向移动、数据分析(在这个基础上...

20000
来自专栏Java技术栈

Java开发必知道的国外10大网站

1、https://www.google.com/ ? 不解释 2、https://stackoverflow.com ? 里面包含各种开发遇到的问题及答案,质...

46770
来自专栏Albert陈凯

Hadoop离线数据分析平台实战——420订单分析Hadoop离线数据分析平台实战——420订单分析

Hadoop离线数据分析平台实战——420订单分析 项目进度 模块名称 完成情况 用户基本信息分析(MR)� 完成 浏览器信息分析(MR) 完...

33860
来自专栏京东技术

京东万台规模Hadoop集群 | 分布式资源管理与作业调度

吴怡燃, 京东大数据平台高级技术专家,擅长大数据平台的资源管理与调度系统的开发与建设。目前专注于以万台分布式调度系统及深度学习平台的开发与建设。

33130
来自专栏云资讯小编的专栏

腾讯云 Postgres-XZ 的数据治理策略

2017第八届中国数据库技术大会于2017年5月11-13日召开,在5月11日的大会中,腾讯云数据库高级工程师,PostgreSQL数据库专家许中清做了腾讯云P...

1.2K00
来自专栏知识图谱

分布式图数据库JanusGraph-优势

JanusGraph设计的目的是处理大图,单机无论是在存储和计算能力上都无法满足大图处理。大规模图实时计算和分析是JanusGraph最基本的优势。本节将讨...

30330
来自专栏微信公众号:Java团长

剖析公司技术栈

来源:www.cnblogs.com/wangsen/p/9329735.html

13940

扫码关注云+社区

领取腾讯云代金券