我有一堆二进制文件压缩成*gz格式。这些是在远程节点上生成的,必须传输到位于数据中心服务器之一的HDFS。
我正在探索用Flume发送文件的选项;我探索了使用假脱机目录配置来执行此操作的选项,但很明显,只有当文件的目录位于同一个HDFS节点的本地位置时,才能这样做。
对如何解决这个问题有什么建议吗?
发布于 2014-10-03 10:01:26
这种情况没有现成的解决办法.但你可以试试这些解决办法:
发布于 2014-10-03 12:37:51
为什么不运行两个不同的Flume代理,一个在远程计算机上,一个在您的日期节点上。远程机器上的代理可以读取假脱机目录并将其发送到avro接收器。datanode上的代理可以读取avro源并将数据转储到HDFS。
https://stackoverflow.com/questions/26168820
复制相似问题