Loading [MathJax]/jax/output/CommonHTML/config.js

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

社区首页 >问答首页 >通过gremlin服务器将多个xml数据文件插入到tinkerpop图形数据库中(带gremlin代码)

问通过gremlin服务器将多个xml数据文件插入到tinkerpop图形数据库中(带gremlin代码)
EN

Stack Overflow用户

提问于 2020-06-12 02:40:04

回答 1查看 117关注 0票数 1

我有一个巨大的数据集，必须通过gremlin (gremlin服务器)插入到图形数据库中。由于xml文件太大(超过8 1gb )，我决定将其拆分为多个可管理的9个xml文件(每个文件大约1 1gb)。我的问题是，有没有一种方法可以通过gremlin服务器将这些数据文件中的每一个插入到我的tinkerpop图形数据库中？比如尝试像这样的东西？或者，插入这些数据的最佳方式是什么？

  graph.io(IoCore.graphml()).readGraph("data01.xml")
  graph.io(IoCore.graphml()).readGraph("data02.xml")
  graph.io(IoCore.graphml()).readGraph("data03.xml")
  graph.io(IoCore.graphml()).readGraph("data04.xml")
  graph.io(IoCore.graphml()).readGraph("data05.xml")

graph-databases

腾讯云域名特惠，新用户首年1元起

腾讯云域名专场特惠：个人新用户.cn仅8.8元/年，企业新用户.com仅1.06元/年...

EN

回答 1

Stack Overflow用户

发布于 2020-06-16 11:58:32

这是一个很大的GraphML文件。我不确定我曾经遇到过这么大的一个。我想知道你是如何拆分它的，因为GraphML文件不容易拆分，因为它们是基于XML的，有一个头和一个结构，其中顶点和边在单独的节点中。正是由于这些(和其他)原因，TinkerPop开发了像Gryo和GraphSON这样的格式，这些格式可以很容易地拆分，以便在类似Hadoop的文件结构中进行处理。

也就是说，假设您正确地拆分了GraphML文件，因此每个文件都是一个完整的子图，我想您应该能够按照您建议的方式加载它们，但是，我担心这样做需要多少内存。io()加载器不适用于批量并行加载，它基本上包含顶点的内存缓存，以加快加载速度。内存中的缓存本质上只是一个不会使其内容过期的HashMap。因此，当加载发生时，您需要能够将特定文件的所有Vertex实例保存在内存中。

我不知道您的需求是什么，也不知道您是如何获得如此大的GraphML文件的，但是对于这种大小的图形，我会查看您正在使用的图形的特定于提供者的批量加载工具，或者使用spark-gremlin或某种Gremlin脚本并行加载数据的自定义方法。

票数 0

EN

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/62336643

复制

相关文章

python中的reduce函数

在python3中，内置函数中已经没有reduce了。要使用reduce，需要从functools模块里引入

Python学习者

2023/09/09

1580

python中reduce函数的用法

reduce:将一个可以迭代的对象应用到两个带有参数的方法上，我们称这个方法为fun,遍历这个可迭代的对象，将其中元素依次作为fun的参数，但是这个函数有两个参数，那些作为参数呢？

用户7886150

2021/01/12

5900

python的reduce()函数

reduce()函数是Python内置的一个高阶函数。 reduce()函数接收的参数和 map()类似，一个函数 f，一个list，但行为和 map()不同，reduce()传入的函数 f 必须接收两个参数，reduce()对list的每个元素反复调用函数f，并返回最终结果值。例如，编写一个f函数，接收x和y，返回x和y的和： 1 2 def f(x, y): return x + y 调用 reduce(f, [1, 3, 5, 7, 9])时，reduce函数将做

用户1214487

2018/01/24

6570

[Python]reduce() 函数

Python reduce() 函数 reduce() 函数会对参数序列中元素进行累积。函数将一个数据集合（链表，元组等）中的所有数据进行下列操作：用传给 reduce 中的函数 function（有两个参数）先对集合中的第 1、2 个元素进行操作，得到的结果再与第三个数据用 function 函数运算，最后得到一个结果。

唯一Chat

2020/02/25

6470

python: reduce函数

python3 中，reduce()函数已经被从全局名字空间里移除了。转而被放置到了 fucntools模块里。

JNingWei

2018/09/28

6100

Python reduce()函数

python 大数据

MapReduce: Simplified Data Processing on Large Clusters Jeffrey Dean and Sanjay Ghemawat https://research.google.com/archive/mapreduce.html 这篇来自谷歌的论文介绍了map/reduce，摘录如下： Abstract MapReduce is a programming model and an associated implementation for

Steve Wang

2018/02/05

7030

python reduce函数

mapreduce 编程算法 java

python内置函数reduce 和 map/filter等函数有点类似，都是通过函数对迭代器中的元素进行遍历操作，唯一区别是reduce函数是返回计算结果是一个值，而map/filter是返回一个序列或者迭代器，下面在做详细解释

猿说编程[Python和C]

2020/03/12

8620

【Python】列表 List ① ( 数据容器简介 | 列表 List 定义语法 | 列表中存储类型相同的元素 | 列表中存储类型不同的元素 | 列表嵌套 )

容器存储 list 数据语法

Python 中的数据容器数据类型可以存放多个数据 , 每个数据都称为元素 , 容器的元素类型可以是任意类型 ;

韩曙亮

2023/10/11

2820

【Python】列表 List ① ( 数据容器简介 | 列表 List 定义语法 | 列表中存储类型相同的元素 | 列表中存储类型不同的元素 | 列表嵌套 )

Python 列表中的sort函数

key list reverse sort 排序

列表中的sort函数功能对当前列表按照一定规律排序用法 list.sort(key=None, reverse=False) 参数 key - 参数比较 reverse –排序规则 reverse = True 降序 reverse = False 升序 ( 默认 ) key涉及函数学习,我们在日后讲解当前默认不传即可注意事项列表中的元素类型必须相同 , 否则无法排序(报错) 字典也可以排序, key或者value排序代码 # coding:utf-8 shu = '01老鼠' niu =

Zkeq

2022/05/18

2.4K0

绑定事件中如可控制函数的执行次数

var flag = true; function onlyOne() { if(flag) { "这里是要执行的代码"; } flag = false//该方法是控制函数仅执行一次因为flag是全局变量 onlyOne()函数执行一次后flag就变成false了函数就执行不了了

大当家

2018/06/28

2.3K0

JS的内建函数reduce

@(js) reduce函数，是ECMAScript5规范中出现的数组方法。在平时的工作中，相信大家使用的场景并不多，一般而言，可以通过reduce方法实现的逻辑都可以通过forEach方法来变相的实现，虽然不清楚浏览器的js引擎是如何在C＋＋层面实现这两个方法，但是可以肯定的是reduce方法肯定也存在数组的遍历，在具体实现细节上是否针对数组项的操作和存储做了什么优化，则不得而知。 ---- [TOC] 数组的reduce方法的应用 reduce方法有两个参数，第一个参数是一个callback，用于针对数

欲休

2018/03/15

1.5K0

【说站】python迭代中删除列表项目

2、通过分配给slice somelist[:]，改变现有列表以仅包含想要的项目。

很酷的站长

2022/11/24

1.6K0

【说站】python迭代中删除列表项目

PHP array_reduce() 函数

array_reduce() 函数向用户自定义函数发送数组中的值，并返回一个字符串。

用户1448800

2021/08/19

4470

如何在环境中存储配置

关于「在环境中存储配置」，是 The Twelve-Factor App 倡导的方法论之一。通常，应用的配置在不同环境（预发布、生产环境、开发环境等等）间会有很大差异，比如说数据库的用户名密码等等配置，通过把配置和代码分离，我们可以保证部署在不同环境的代码完全一致，如何把配置和代码分离呢？最佳实战是把配置存储到环境变量中，它可以非常方便地在不同的部署间做修改，却不动一行代码；与配置文件不同，不小心把它们签入代码库的概率微乎其微；此外环境变量与语言和系统无关。

LA0WAN9

2021/12/14

1.2K0

Python 3.x中reduce()函数完整用法

在Python 3.x中，reduce()不再是内置函数，而是移到了标准库functools中，需要先导入再使用，其官方解释如图所示：

Python小屋屋主

2018/07/23

7190

Python 3.x中reduce()函数完整用法

如何在Dart中合并列表

dart 编程算法

在 Dart 编程中，List 数据类型类似于其他编程语言中的数组。列表用于表示对象的集合。它是一组有序的对象。Dart 中的核心库负责 List 类的存在、创建和操作。有 5 种方法可以组合两个或多个列表：

徐建国

2021/12/01

2.1K0

点击加载更多

相似问题

如何在PHP中退出数组迭代函数(array_reduce)

58

迭代器中reduce和reduce的区别

22

如何在reduce函数中填充新列表- Kotlin

213

如何在C#中迭代列表中的每个列表？

12

对列表中的每个项目进行迭代的函数

12

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例