我在hdfs中有一个文件夹,其中有两个子文件夹,每个子文件夹大约有30个子文件夹,最后,每个子文件夹都包含xml文件。我想列出所有的xml文件,只给出主文件夹的路径。在本地,我可以使用apache commons-io's FileUtils.listFiles()来做这件事。我已经试过了
FileStatus[] status = fs.listStatus( new Path( args[ 0 ] ) );
但它只列出了前两个子文件夹,并没有更进一步。在hadoop中有什么方法可以做到这一点吗?
https://stackoverflow.com/questions/11342400
复制相似问题