在我们的项目中,我们将数据从一个数据库(Oracle)加载到另一个数据库(Oracle),并对其运行一些批次级别的分析。
到目前为止,这是通过pl/sql作业完成的,我们将3年的数据提取到目标数据库中。
我有一项任务是使用APache nifi自动执行流程。
集群信息: 1. 5节点的APache hadoop集群2.所有软件都是开源的。
我尝试创建一个使用processor queryDatabaseTable -> putDatabaseRecord的流。但据我所知,queryDatabaseTable输出的是avro格式。
我请求建议如何转换,处理器顺序应该是什么,我还需要处理增量加载/更改数据捕获。敬请指教。提前感谢:)
发布于 2018-09-06 03:17:05
配置了Avro读取器的PutDatabaseRecord将能够读取由QueryDatabaseTable生产的Avro。
https://stackoverflow.com/questions/52183532
复制相似问题