我正在使用OrientDB开发一个POC。我已经在3台服务器上设置了它。我阅读了OrientDB文档,并想知道以CSV文件的形式加载数据的最佳方法。该模式具有3个类顶点和3个类边,它们之间应该相互关联。
以下是我的一些问题:
1)就ETL性能而言,如果为每个类创建3个集群并将每个集群分配给其中一个服务器,这是否有意义?(基于这个链接:http://orientdb.com/docs/2.2.x/Distributed-Sharding.html --我在现阶段不担心容错)
2)关于ETL存储过程,我正在考虑三个选项:
对于第二和第三种方法,我需要手动提供记录Ids,我怀疑如何确保不创建重复的顶点。索引有助于避免这种情况吗?以上三种方法在性能上比较如何?
3)是否可以使用ETL工具中的"plocal“选项将OrientDB集群的一个服务器存储在该机器中?
( 4)即使OrientDB在分布式模式下运行,也可以对ETL使用plocal选项吗?
发布于 2016-08-26 18:39:46
https://stackoverflow.com/questions/39169421
复制相似问题