我们正在使用Talend Open Studio for Big Data将MySQL数据迁移到Neo4j。我有几个作业要运行,但是我在rels.csv文件上使用tNeo4jOutputRelationship组件时遇到了问题,这个组件包含了nodes.csv文件中不存在的值之间的关系。我们确实有相当多的重构数据,并不是每个rels.csv都会与每个作业的nodes.csv匹配。
我收到了一些以rapidminer的ExampleSets格式的实验数据。数据表示为一个具有多个“数据条目”的单一存储库(不确定是否有正确的术语)。将其导出到更方便的格式、保持文件夹结构和命名的最简单方法是什么?
我知道如何通过创建一个进程导出单个文件,该进程由检索存储库、 how 、写文件组成。不太适合我,因为我有很多存储库/文件。