在hadoop中搭建lzo环境: wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.06.tar.gz export CFLAGS.../configure -enable-shared -prefix=/usr/local/hadoop/lzo/ make && make test && make install 在hadoop-env.sh...,com.hadoop.compression.lzo.LzopCodec,org.apache.hadoop.io.compress.BZip2Codec ... io.compression.codec.lzo.class com.hadoop.compression.lzo.LzoCodec...property> mapred.child.env LD_LIBRARY_PATH=/usr/local/hadoop/lzo
hadoop支持Lzo压缩配置 1)hadoop本身并不支持lzo压缩,故需要使用twitter提供的hadoop-lzo开源组件。...hadoop-lzo需依赖hadoop和lzo进行编译,编译步骤如下。...增加配置支持LZO压缩 <?...文件的索引,lzo压缩文件的可切片特性依赖于其索引,故我们需要手动为lzo压缩文件创建索引。...此时的lzo文件如果去执行mr任务时任然只会产生一个切片,lzo压缩文件的可切片特性依赖于其索引,故我们需要手动为lzo压缩文件创建索引。
1.问题描述 CDH中默认不支持Lzo压缩编码,需要下载额外的Parcel包,才能让Hadoop相关组件如HDFS,Hive,Spark支持Lzo编码。...通过Yarn的8088可以发现是因为找不到Lzo压缩编码: Compression codec com.hadoop.compression.lzo.LzoCodec was not found. ?...配置HDFS的压缩编码加入Lzo: com.hadoop.compression.lzo.LzoCodeccom.hadoop.compression.lzo.LzopCodec ? ?...2.1 Hive验证 首先确认test_table2中的文件为Lzo格式: ? 在Hive的beeline中进行测试: ? ? Hive基于Lzo压缩文件运行正常。...SparkSQL基于Lzo压缩文件运行正常。 醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!
LZO 是致力于解压速度的一种数据压缩算法,LZO 是 Lempel-Ziv-Oberhumer 的缩写。这个算法是无损算法,参考实现程序是线程安全的。 实现它的一个自由软件工具是lzop。...LZO 库实现了许多有下述特点的算法: * 解压简单,速度非常快。 * 解压不需要内存。 * 压缩相当地快。 * 压缩需要 64 kB 的内存。...* 另外还有一个只需要 8 kB 内存的压缩级别。 * 算法是线程安全的。 * 算法是无损的。 LZO 支持重复压缩以及原地解压。 LZO 是块压缩算法——压缩解压成块的数据。...压缩与解压所用块的大小必须一样。 LZO 将数据块压缩成匹配数据(滑动字典)与非匹配文字的序列。...当处理不可压缩数据的时候,LZO 将每个 1024 字节的输入数据块扩展 16 字节。
lzo压缩格式有很快的压缩/解压速度和合理的压缩率,并且支持分块(split),所以lzo是目前在Hadoop中最流行的压缩格式。hadoop中的lzo不是自带的,如果要支持lzo,需要另外安装。...本文介绍了在hadoop2.0上安装和配置lzo,同样也适用于hadoop1.0。 1 安装linux的lzo库 需要在集群的每一个节点都安装lzo库,假定都64位的机器。...下的lzo压缩命令行工具,方便大家在linux下压缩lzo文件,不是必需的。...mvn clean package -Dmaven.test.skip=true 注意:如果前面的linux lzo库没有安装在标准目录下,在用maven编译前需要设置C_INCLUDE_PATH和LIBRARY_PATH...cp target/native/Linux-amd64-64/* $HADOOP_HOME/lib/native/ cp target/hadoop-lzo-0.4.18-SNAPSHOT.jar
LZO压缩配置--切片(另一种常用的是snappy压缩--快) 1)hadoop本身并不支持lzo压缩,故需要使用twitter提供的hadoop-lzo开源组件。...hadoop-lzo需依赖hadoop和lzo进行编译,编译步骤如下。.../hadoop/common ls hadoop-lzo-0.4.20.jar 3)同步hadoop-lzo-0.4.20.jar到hadoop003、hadoop004 xsync hadoop-lzo...-0.4.20.jar 4)core-site.xml增加配置支持LZO压缩 <?.../input/bigtable.lzo 建立lzo索引文件.jpg 3.再次执行wordcount: hadoop jar /opt/module/hadoop-2.7.2/share/hadoop
package -Dmaven.test.skip=true 进行打包构建,构建成功后, 拷贝编译文件 cp -a hadoop-lzo/target/native/Linux-amd64-64...hbase org.apache.hadoop.hbase.util.CompressionTest /user/webmaster/word/in/tt2 lzo //压缩lzop,解压缩.../user/webmaster/rand 经过测试同样的数据: 不设置任何压缩的hbase表,所占存储空间最大 经过snappy压缩的表,存储空间明显变小 经过lzo压缩的表,存储空间最小...遇到的问题: 一个hbase中,如果同时有两种压缩表,一个是lzo压缩的表,一个是snappy压缩的表,那么在使用java client去scan数据时,可能会有regionserver会挂掉...DataXceiver.java:251) at java.lang.Thread.run(Thread.java:745) 经过查资料,发现说的都是hbase的客户端租约超时,或者是linux
关于Presto对lzo压缩的表查询使用记录 0.写在前面 1.正文 0.提前说明 1.查询ads层表 2.查询dwd|dws|dwt层表 3.查询ods层表 ---- ---- 0.写在前面 实验背景...:离线数仓项目 Presto版本:0.196 Hive版本:3.1.2 Hadoop版本:3.1.3 1.正文 0.提前说明 纯lzo压缩:ods层 parquet列式存储加lzo压缩:dwd,dws,...❞ 2.查询dwd|dws|dwt层表 ❝「Presto不支持parquet列式存储加lzo压缩的表的查询」 ❞ Presto-Client查询语句: select * from dwd_start_log...执行查询语句,不再报错 presto:gmall> select * from dwd_start_log 3.查询ods层表 ods_log表是纯lzo压缩 presto:gmall> select...* from ods_log; 美团技术团队文章关于「Presto二次开发和BUG修复」提到:Presto不支持查询lzo压缩的数据,需要修改hadoop-lzo的代码 ❝https://tech.meituan.com
下载、安装并编译LZO 1 wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.10.tar.gz 2 tar -zxvf lzo...-2.10.tar.gz 3 cd lzo-2.10 4 ....编译hadoop-lzo源码 2.1 下载hadoop-lzo的源码 下载地址:https://github.com/twitter/hadoop-lzo/archive/master.zip ...export C_INCLUDE_PATH=/usr/local/hadoop/lzo/include export LIBRARY_PATH=/usr/local/hadoop/lzo/lib...2.4 编译 进入hadoop-lzo-master,执行maven编译命令 mvn package -Dmaven.test.skip=true 2.5 进入target hadoop-lzo
前面的文章介绍了Hadoop lzo的安装和配置(见 http://www.linuxidc.com/Linux/2014-05/101090.htm ),本文接着介绍lzo压缩在hadoop应用程序中的使用方法...如果没有索引,lzo文件也是可以处理的,mapreduce会根据后缀名“.lzo”来对lzo文件解压,并且inputformat也不需要特别指定,但是不支持分块,整个lzo文件只用一个map来处理。...2 在mapreduce程序中使用lzo压缩 把inputformat设置成LzoTextInputFormat, job.setInputFormatClass(LzoTextInputFormat.class... 0.4.20 3 在streaming程序中使用lzo压缩 把inputformat设置为DeprecatedLzoTextInputFormat...4 在hive中使用lzo压缩 同样在建表的时候需要指定inputformat为DeprecatedLzoTextInputFormat,outputformat为 HiveIgnoreKeyTextOutputFormat
一、概述 LZMA (Lempel-Ziv-Markov chain-Algorithm) 基于著名的LZ77压缩算法改进的压缩/解压工具,特点:高压缩率,高解压速度,低内存消耗,lzma命令行工具使用方式和...对比两大主流压缩工具:gzip,bzip2: 1,lzma和bzip2在速度上面远远输给gzip,但在压缩率方面,lzma算法占优势。...2,lzma拥有比gzip,bzip2更高的压缩比率,压缩后文件更小,纯文本文件压缩更加明显,在解压方面比bzip2速度快出数倍,对于想要有较高的压缩率,又不想消耗太多内存,lzma是首先。...3,文件属性,lzma压缩和解压缩能保持文件所有人,权限和修改时间等信息,但是gzip不保存这些信息。...可以发现,原始文件通过zma压缩后,缩小了12.8倍。
.tar (注:tar是打包,不是压缩!)...FileName.tar -C DirName 打包:tar cvf FileName.tar DirName .gz 解压1:gunzip FileName.gz 解压2:gzip -d FileName.gz 压缩...:gzip FileName .tar.gz 解压:tar zxvf FileName.tar.gz -C DirName 压缩:tar zcvf FileName.tar.gz DirName .bz2...压缩:tar jcvf FileName.tar.bz2 DirName .tar.Z 解压:tar Zxvf FileName.tar.Z 压缩:tar Zcvf FileName.tar.Z DirName....tgz 解压:tar zxvf FileName.tgz 压缩:tar zcvf FileName.tgz FileName .tar.tgz 解压:tar z
在Linux解压数据包时经常使用命令行,但是各种压缩包需要使用不同的命令压缩、解压,本文汇总相关命令。...命令汇总 压缩包格式 解压命令 压缩命令 .tar tar xvf FileName.tar -C target_dir tar cvf FileName.tar DirName .gz
linux压缩文件扩展名有以下几种: *.Z compress程序压缩的扩展名 *.gz gzip压缩后的扩展名 *.bz2 bzip2压缩后的扩展名 *.tar...tar打包后的扩展名,没有被压缩过 *.tar.gz tar打包后经过gzip压缩后的扩展名 *.tar.bz2 tar打包后经过bzip2压缩后的扩展名 这些扩展名的意义是方便识别是那种压缩指令进行压缩的...gzip 文件名 参数: -v: 显示压缩比等信息 -c: 将压缩的数据输出到屏幕上,可以通过数据流重导向来处理 -d: 解压缩参数 使用-v参数显示压缩比,压缩后文件名为man_dbtest.conf.gz...tar指令的参数非常多 -j: 通过bzip2支持进行压缩/解压缩 -z: 通过gzip支持进行压缩/解压缩 -v: 在压缩/解压缩过程中,将正在处理的文件名显示出来 -c: 建立压缩文件...-f filename.tar.bz2 解压缩:tar -jxv -f filename.tar.bz2 -C 要将压缩文件解压缩到的目录 gzip支持的压缩/解压缩方式 压缩:tar -zcv
在Windows操作系统中,常见的有rar、zip等压缩文件格式,使用如 winrar 软件即可完成压缩与解压缩的操作。...在Linux操作系统中,压缩的命令及文件格式更多,本文主要列举常用的压缩与解压缩命令。...压缩打包处理命令tar:打包及压缩zip / unzip:压缩及解压缩 zip 文件rar:压缩及解压缩 rar 文件打包及压缩命令 tartar 命令是Linux下最常用的打包压缩命令,可以将多个文件或目录打包压缩成一个文件...命令格式:tar [参数] 文件名 文件/目录名-c 建立打包文件-x 压缩打包 或 解压缩-t 查看打包文件的内容-z 通过 gzip 的方式进行压缩 / 解压缩,文件名为:.tar.gz-j...rar命令格式:# 压缩rar [参数] 文件名.rar 文件/目录名# a 将文件添加到压缩文件# 解压缩rar [参数] 文件名.rar 目录名# x 解压缩命令示例:# 将目录内的文件生成压缩文件
一、安装lzop: yum -y install lzop 二、安装lzo 1、wget http://www.oberhumer.com/opensource/lzo/download/lzo-2.06....tar.gz 2、tar -zxvf lzo-2.06.tar.gz 3、mv lzo-2.06 lzo && cd lzo 4、export CFLAGS=-m64 5、..../hadoop-lzo 2、解压后是hadoop-lzo-master,进入hadoop-lzo-master目录 3、export CFLAGS=-m64 4、export CXXFLAGS=-m64.../Linux-amd64-64/lib目录,将lib目录下的文件拷贝到hadoop的lib/native目录下:tar -cBf - -C target/native//Linux-amd64-64/lib...://www.linuxidc.com/Linux/2014-03/98602.htm
bin/ chmod +x /usr/bin/rar 2.使用 rar a -m5 -o+ -hp123456 test.rar dir1 dir2 # 参数说明 a 添加文件到压缩文件...m 设置压缩级别(0-存储...3-默认...5-最大) o[+|-] 设置覆盖模式 hp[密码] 同时加密文件数据和文件头 t...测试压缩文件 x 用绝对路径解压文件 二、zip使用 zip -r -q -P123456 test.zip dir1 dir2 # 参数说明 -r
常用压缩格式:.zip, .gz ,.bz2,tar.gz, .tar.bz2 Linux中常用的软件包都是用红色展示的 压缩文件不一定比原文件小,因为压缩文件还包括压缩格式,当原文件比较小时,压缩文件可能会比原文件大....zip压缩 Windows和Linux中的.zip格式是通用的 zip 压缩文件名 源文件 //压缩文件 例:zip 12.zip(必须要加后缀名) 12 zip -r 压缩目录名 源目录 /.../压缩目录 .zip格式解压缩 unzip 压缩文件 //解压缩文件 .gz格式压缩 Windows可以解压缩Linux的.gs格式文件,Linux不能解压缩Windows的.rar格式文件 gzip...,但是不能压缩目录 .gz解压缩(压缩文件不保留) gzip -d 压缩文件 //解压缩文件 gunzip 压缩文件 //解压缩文件 .bz2压缩 bzip2 源文件名 //压缩文件,源文件会消失...bzip2 -k 源文件 //压缩后保留源文件 bzip2不能压缩目录 .bz2解压缩 bzip -d 压缩文件 //解压bzip2文件(-k保留压缩文件) bunbzip 压缩文件 //压缩文件(
gzip 是在 Linux 系统中经常使用的一个对文件进行压缩和解压缩的命令,既方便又好用。...语法:gzip [选项] 压缩(解压缩)的文件名该命令的各选项含义如下: -c 将输出写到标准输出上,并保留原有文件。-d 将压缩文件解压。...-l 对每个压缩文件,显示下列字段: 压缩文件的大小;未压缩文件的大小;压缩比;未压缩文件的名字-r 递归式地查找指定目录并压缩其中的所有文件或者是解压缩。-t 测试,检查压缩文件是否完整。...-v 对每一个压缩和解压的文件,显示文件名和压缩比。...-num 用指定的数字 num 调整压缩的速度,-1 或 --fast 表示最快压缩方法(低压缩比),-9 或--best表示最慢压缩方法(高压缩比)。系统缺省值为 6。
命令 常用功能 gzip 压缩和解压缩 gunzip 解压缩 zcat 查看压缩文件内容 zless 查看压缩文本文件内容...; -z 或 --compress:强制执行压缩; 压缩与解压缩 #压缩a文件为a.bz2,并删除a文件 bzip2 a #压缩a文件为a.bz2,并保留a文件 bzip2 -k a 这里压缩的时候没有标准输出...命令 常用功能 rar 压缩和解压缩 unrar 解压缩 压缩与解压缩 #压缩文件 rar a test a b c image-20200414224941647.png...#要测试归档的完整性,使用: $ 7z t image-20200415101739102.png 参考: https://www.linuxidc.com/Linux...,在最右边 -p 保留备份数据的原本权限与属性,常用于备份(-c)重要的配置文件 -P 保留绝对路径 Linux主要有三种压缩方式 gzip:是公认的压缩这速度最快,压缩大文件的时候与其他的压缩方式相比更加明显
领取专属 10元无门槛券
手把手带您无忧上云