我已经在我的Linux计算机上下载了以下文件:
wget https://github.com/tomwhite/hadoop-book/blob/master/input/ncdc/all/1901.gz
我试图使用gunzip 1901.gz解压缩文件,但是它没有工作。我使用“file”命令检查文件格式,它说:
1901.gz: HTML document, UTF-8 Unicode text, with very long lines
我对Linux非常陌生。我可以知道如何成功地提取数据以供使用吗?