前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >JanusGraph-配置(第四章)--英文翻译

JanusGraph-配置(第四章)--英文翻译

作者头像
陈黎栋
发布2020-02-18 15:00:35
1.1K0
发布2020-02-18 15:00:35
举报

Chapter 4. Configuration

JanusGraph数据库集群通常包含一个或多个JanusGraph实例. 运行实例需要提供JanusGraph的配置参数.

JanusGraph配置中定义了JanusGraph要使用哪些组件, 控制部署各个操作, 提供一系列的动态调整的参数, 来获得集群的最大性能.

一般情况, JanusGraph配置必须提供存储后台. Part III, “Storage Backends” 列出了全部支持的存储后台, 如何配置参数. 如果需要支持图的高级检索(例如:全文检索, 地理位置检索, 和范围检索) 需要配置索引后台. Part IV, “Index Backends”. 如果性能是主要考虑方面, 需要打开缓存功能. 开启缓存和缓存的配置的详细内容在Chapter 11, JanusGraph Cache.

4.1 配置示例

以下示例展示了如何配置存储后台, 索引和性能组件. 这部分只是参数配置的一小部分. 完整的配置列表, 请查看 Chapter 13, Configuration Reference

4.1.1 Cassandra+Elasticsearch

使用Cassandra存储后台(本地的), 和ElasticSearch索引(远程的), 配置如下:

代码语言:javascript
复制
storage.backend=cassandra
storage.hostname=localhost

index.search.backend=elasticsearch
index.search.hostname=100.100.101.1, 100.100.101.2
index.search.elasticsearch.client-only=true

4.1.2 HBase+Caching

使用HBase存储后台(远程), 要获得更好的性能需要开启缓存

代码语言:javascript
复制
storage.backend=hbase
storage.hostname=100.100.101.1
storage.port=2181

cache.db-cache = true
cache.db-cache-clean-wait = 20
cache.db-cache-time = 180000
cache.db-cache-size = 0.5

4.1.3 BerkeleyDB

使用内嵌的BerkeleyDB存储后台, 内嵌的ElasticSearch索引

代码语言:javascript
复制
storage.backend=berkeleyje
storage.directory=/tmp/graph

index.search.backend=elasticsearch
index.search.directory=/tmp/searchindex
index.search.elasticsearch.client-only=false
index.search.elasticsearch.local-mode=true

Chapter 13, Configuration Reference 包含全部的配置信息. 配置文件中包含完整的配置示例.

4.1.4 更多配置

conf目录下有一些配置示例, 可以快速的开始练习. 把配置文件的路径传给JanusGraphFactory.open(...)方法

代码语言:javascript
复制
// Connect to Cassandra on localhost using a default configuration
graph = JanusGraphFactory.open("conf/janusgraph-cassandra.properties")
// Connect to HBase on localhost using a default configuration
graph = JanusGraphFactory.open("conf/janusgraph-hbase.properties")

4.2 使用配置

如何配置JanusGraph实例, 依赖于实例的运行模式.

4.2.1 JanusGraphFactory

4.2.1.1 Gremlin Console

JanusGraph中的Gremlin命令行工具可以方便的启动JanusGraph并和其交互. 执行bin/gremlin.sh(Unix/Linux系统)或者bin/gremlin.bat(Windows系统)来启动命令行, 随后用JanusGraphFactory工厂类读取某个配置文件, 新建graph对象

代码语言:javascript
复制
graph = JanusGraphFactory.open('path/to/configuration.properties')

4.2.1.2 JanusGraph Embedded

基于JVM应用的内部, 也能用JanusGraphFactory创建实例, . 在这种情况下, JanusGraph属于应用的一部分, 应用可以直接调用它的接口

4.2.1.3 Short Codes

如果配置JanusGraph集群, 需要定义存储后台. JanusGraphFactory接受一个分号分割的字符串, 分号前是存储后台类型的名称, 分号后是主机名称或者是目录

代码语言:javascript
复制
graph = JanusGraphFactory.open('cassandra:localhost')
代码语言:javascript
复制
graph = JanusGraphFactory.open('berkeleyje:/tmp/graph')

4.2.2 JanusGraph Server

JanusGraph仅仅是一些jar文件, 不提供执行线程. 连接和使用JanusGraph数据库, 有两种方法:

1. 客户端程序提供执行线程, 在客户端程序中调用JanusGraph 2. JanusGraph内置了可以长时间运行的程序, 当启动该程序, 允许远程客户端或者其他程序调用JanusGraph. 这个长时间运行的程序就是JanusGraph Server

JanusGraph Server使用Gremlin Server(Apache TinkerPop stack) 处理客户端的请求. JanusGraph提供开箱即用的配置, 能够JanusGraph Server快速启动, 这些配置可以被修改, 来调整服务器的性能.

配置JanusGraph Server需要通过./conf/gremlin-server目录下的yaml文件. JanusGraph Server配置如下:

代码语言:javascript
复制
...
graphs: {
  graph: conf/janusgraph-berkeleyje.properties
}
plugins:
  - janusgraph.imports
...

图的定义是在配置文件中提供的, 上边的例子中, 图的配置文件是conf/janusgraph-berkeleyje.properties. 插件启用了JanusGraph Gremlin插件, 这个插件能够自动导入JanusGraph的类, 远端提交的脚本可以参考这些类.

查看更多JanusGraph Server, 请看Chapter 7, JanusGraph Server

4.2.2.1 Server Distribution

JanusGraph zip文件中包含服务器组件, 可以让Gremlin和JanusGraph快速启动. 通过执行bin/janusgraph.sh 可以启动Gremlin Server和Cassandra和Elasticsearch.

Note

由于安全原因 Elasticsearch and janusgraph.sh 必须使用非root账户运行

4.3 全局配置

JanusGraph分为本地和全局配置. 本地配置适用于单独的JanusGraph实例. 全局配置适用于集群中的全部实例. JanusGraph有以下5个范围的配置:

  • LOCAL 只适用于单独的JanusGraph实例, 而且需要在实例初始化时提供
  • MASKABLE 用本地配置文件启动的单独实例, MASKABLE参数可以被覆盖. 如果本地配置文件没有提供参数, 会读取全局集群的配置.
  • GLOBAL 从全局集群配置中读取, 而且不能被覆盖
  • GLOBAL_OFFLINE 与GLOBAL类似, 但修改这类参数, 需要启动集群, 确保集群中获得同一个值
  • FIXED 与GLOBAL类似, 但这些值不能被修改

当集群中第一个实例启动, 全局配置便被从本地文件初始化了. 可以通过系统提供的API来修改全局配置参数. 调用实例g.getManagementSystem()方法,可以访问管理API.例如, 修改一个集群默认的缓存行为

代码语言:javascript
复制
mgmt = graph.openManagement()
mgmt.get('cache.db-cache')
// Prints the current config setting
mgmt.set('cache.db-cache', true)
// Changes option
mgmt.get('cache.db-cache')
// Prints 'true'
mgmt.commit()
// Changes take effect

4.3.1 修改离线参数

修改配置参数不会影响运行着的实例, 只会对新启动的实例有作用. 修改GLOBAL_OFFLINE级别的配置, 需要重启集群, 让全部实例生效. 如下步骤:

  • 集群仅留一个实例
  • 连接到该实例上
  • 确保全部业务都关闭
  • 确保没有新的业务被启动
  • 打开管理API
  • 修改配置参数
  • 调用commit方法, commit方法会自动将实例停止
  • 重启全部实例

查看全部配置参数, 请跳到Chapter 13, Configuration Reference, 其中包括各个范围的参数

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
Elasticsearch Service
腾讯云 Elasticsearch Service(ES)是云端全托管海量数据检索分析服务,拥有高性能自研内核,集成X-Pack。ES 支持通过自治索引、存算分离、集群巡检等特性轻松管理集群,也支持免运维、自动弹性、按需使用的 Serverless 模式。使用 ES 您可以高效构建信息检索、日志分析、运维监控等服务,它独特的向量检索还可助您构建基于语义、图像的AI深度应用。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档