基本说明

最近更新时间:2019-07-30 14:59:07

DistCp(distributed copy)是用于大型内部/群集内复制的工具。它使用 MapReduce 来实现其分发,错误处理和恢复以及报告。它将文件和目录的列表扩展为映射任务的输入,每个任务将复制源列表中指定的文件的分区。DistCp 是 Hadoop 自带的文件迁移工具。