1)从大型压缩文件中提取
我想从linux服务器上的大型zip文件(30Gb+)中提取文件。有足够的空闲磁盘空间。
我试过jar xf dataset.zip了。但是,有一个错误是push button is full,它无法提取所有的文件。
我试过unzip,但是but文件损坏了。
Archive: dataset.zip
warning [dataset.zip]: 35141564204 extra bytes at beginning or within zipfile
(attempting to process anyway)
error [dataset.zip]: st
我已经在我的Linux计算机上下载了以下文件:
wget https://github.com/tomwhite/hadoop-book/blob/master/input/ncdc/all/1901.gz
我试图使用gunzip 1901.gz解压缩文件,但是它没有工作。我使用“file”命令检查文件格式,它说:
1901.gz: HTML document, UTF-8 Unicode text, with very long lines
我对Linux非常陌生。我可以知道如何成功地提取数据以供使用吗?
我有几个使用Vim的系统,其中一个系统无法查看/编辑压缩文件。我相信我有正确的插件,因为我的Vim 7.0的另一个系统可以与相同的插件正常工作。
我得到一个错误:
$ vi admin.war
~
...
~
***error*** (zip#Browse) unzip not available on your system
我的机器:
$ uname -srmo
Linux 2.6.35.4-rscloud x86_64 GNU/Linux
$ vim --v
VIM - Vi IMproved 7.2 (2008 Aug 9, compiled Sep 28 2010 11:05:08