如何利用bzip2对hdfs数据进行压缩,使其在解压缩时具有与最初相同的dir结构。我试图用bzip2进行压缩,但由于生成了许多映射程序,所以它生成了许多文件,因此很难恢复到相同dir结构中的纯文本文件(初始形式)。就像在unix中一样,如果我们使用tarball压缩bzip2,然后解压bzip2.tar,那么had给出的数据和文件夹结构与最初的完全相同。压缩:- tar -cjf compress_folder.tar.bz2压缩<
我需要一些帮助来创建一个循环,它将我的一个文件的扩展名为.tar.gz,解压缩,解压缩,并使用grep -a >> output.text搜索里面的文件(扩展名为.tlg)。在outout.text中,我将需要匹配的数据以及文件的名称和它所来自的父tar
执行此搜索后,我希望删除未删除的文件,并继续处理下一个tar文件,直到检查完所有tar文件。我不能