首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

「Go开源包」snappy:google开源的快速、无损压缩包

今天给大家推荐的是一个google开源的快速、无损的压缩包:snappy。 snappy算法是google开源的。该包是google使用go语言来实现的。...例如,与zlib的最快压缩模式相比,snappy依然比其快了一个数量级,但产生的压缩文件要比zip的大20%到100%。...特性 snappy压缩算法具有以下特性: 快速:压缩速度大概在250MB/秒及更快的速度进行压缩。...Snappy位流格式是稳定的,不会在版本之间发生变化 健壮性:Snappy解压缩器设计为不会因遇到损坏或恶意输入而崩溃 性能 Snappy的目标是快速。...在我们的测试中,Snappy通常比同一级别的算法(如LZO、LZF、QuickLZ等)更快,同时实现了类似的压缩率。 示例 我们看下snappy的使用。

1.5K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Hadoop 数据压缩简介

    在处理大量数据时,这两项节省可能非常重要,因此需要仔细考虑如何在 Hadoop 中使用压缩。 1. 要压缩什么?...由于 Map 输出被写入磁盘并通过网络传输到 Reducer 节点,所以通过使用 LZO 或 Snappy 等快速压缩器,由于减少了传输的数据量从而获得性能提升。 2. 常见压缩格式 ?...例如,与 zlib 的最快压缩模式相比,Snappy 对于大多数输入都快了一个数量级,但是生成的压缩文件都要比 zlib 模式大20%到100%。...有关压缩和输入拆分的问题 当考虑如何压缩由 MapReduce 处理的数据时,重要的是要了解压缩格式是否支持分割。考虑存储在 HDFS 中大小为 1GB 的未压缩文件。...假设我们有一个大小为 1GB 的 gzip 压缩文件,和以前一样,HDFS 将文件存储为16块。

    1.6K20

    【Android开发】如何打包压缩文件、文件夹?

    前言 在开发Android应用过程中,基本都会遇到需要压缩文件的需求,比如打包日志文件上传等功能,今天就来看看如何开发一个通用的工具类用于压缩文件或文件夹。...压缩文件 用java来压缩文件主要就是使用java.util.zip包下的类,首先就是要创建一个ZipOutputStream对象,如下 val fos = FileOutputStream(dist)...压缩文件夹 文件夹比较复杂,因为涉及到目录层级,所以添加条目的时候也需要有层级,而且要跟原目录层级一样,这样解压出来才能还原目录。...比如前面压缩文件的时候,创建ZipEntry时传入的条目名称是“xxx.txt”,只是单一的文件名称。...总结 这样我们就可以打包压缩文件或文件夹了,为了方便可以封装成一个工具类,方便以后使用。

    70320

    如何在linux中不解压查看压缩文件

    归档与压缩文件 归档是将多个文件或文件夹或两者合并为一个文件的过程。在这种情况下,生成的文件不会被压缩。 压缩是一种将多个文件或文件夹或两者合并为一个文件并最终压缩生成的文件的方法。...存档不是压缩文件,但压缩文件可以是存档。 1. 使用 vim 编辑器 vim 不仅仅是一个编辑器。使用 vim,我们可以做很多事情。以下命令显示压缩存档文件的内容,而不对其进行解压缩。...因此,你还可以使用以下命令查看存档/压缩文件的内容: $ gunzip -c rumenz.tar.gz 9.使用zless命令 要使用 zless 命令查看存档/压缩文件的内容,只需执行以下操作:...运行以下命令以使用less命令查看存档/压缩文件的内容: $ less rumenz.tar.gz 原文:https://ostechnix.com/how-to-view-the-contents-of-an-archive-or-compressed-file-without-extracting-it

    2.8K20

    Hive的数据压缩介绍及使用

    无 Snappy .snappy 否 为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示 压缩格式 对应的编码/解码器 DEFLATE org.apache.hadoop.io.compress.DefaultCodec...org.apache.hadoop.io.compress.SnappyCodec 压缩性能的比较 压缩算法 原始文件大小 压缩文件大小 压缩速度 解压速度 gzip 8.3GB 1.8GB 17.5MB...先让我们到snappy的开源网站上 http://google.github.io/snappy/ On a single core of a Core i7 processor in 64-bit...我们可以看到snappy压缩达到了250MB/s,解压达到了500MB/s,这性能直接碾压上面所列举的那几个!所以snappy也常作为企业数据压缩格式! 接着我们来看看如何配置压缩参数?...最终数据输出压缩为块压缩 hive(default)>set mapreduce.output.fileoutputformat.compress.type=BLOCK; 测试一下输出结果是否是压缩文件

    1.2K20

    打工人必备:Hive小文件合并与数据压缩

    五、压缩文件的处理 对于输出结果为压缩文件形式存储的情况,要解决小文件问题,如果在map输入前合并,对输出的文件存储格式并没有限制。...本次主要探讨是数据仓库在数据存储阶段对资源消耗的优化,下面将通过2个方面展开,分别是:数据仓库如何配置,可以实现数据压缩,降低数据的存储量,达到减少对DISK的消耗;数仓表如何设计,可以降低文件信息存储量...•TextFile文件,Snappy压缩 查看数据文件,可看到数据文件多个.snappy压缩文件。...•存储方式:数据按行分块,每块按照列存储;•压缩快 快速列存取•效率比RCFile高,是RCFile的改良版本。...Parquet •Parquet,Snappy压缩 Avro •Avro,Snappy压缩 不同压缩算法比较 ?

    2.5K20

    Hadoop 如何使用压缩

    就如上一篇文章介绍的那样,如果输入文件是压缩文件,当 MapReduce 程序读取压缩文件时,根据文件名的后缀来选择 codes,输入文件自动解压缩(我们不需要指定压缩文件是哪一种压缩格式)。...mapreduce.map.output.compress.codec", LzoCodec.class, CompressionCodec.class); Job job = Job.getInstance(conf); 1.3 Snappy...正如我们所看到的,LZO 文件略大于对应的 gzip 文件,但都比原来未压缩文件小得多。另外,LZO 文件压缩速度快了近五倍,解压速度快了两倍。...我们还可以看到 Snappy 文件比相应的 LZO 文件大,但仍然是原来未压缩文件的一半。另外,Snappy 的压缩和解压缩速度都比 LZO 更快。...总之,Snappy 在压缩和解压缩时间方面速度更快,但在压缩比方面效率更低。

    2.2K20

    如何在Scala中读取Hadoop集群上的gz压缩文件

    存在Hadoop集群上的文件,大部分都会经过压缩,如果是压缩后的文件,我们直接在应用程序中如何读取里面的数据?...答案是肯定的,但是比普通的文本读取要稍微复杂一点,需要使用到Hadoop的压缩工具类支持,比如处理gz,snappy,lzo,bz压缩的,前提是首先我们的Hadoop集群得支持上面提到的各种压缩文件。...本次就给出一个读取gz压缩文件的例子核心代码: 压缩和解压模块用的工具包是apache-commons下面的类: import org.apache.commons.io.IOUtils import...上调试用 至此数据已经解压并读取完毕,其实并不是很复杂,用java代码和上面的代码也差不多类似,如果直接用原生的api读取会稍微复杂,但如果我们使用Hive,Spark框架的时候,框架内部会自动帮我们完成压缩文件的读取或者写入

    2.7K40

    如何在linux中查看存档或压缩文件的内容

    归档与压缩文件 归档是将多个文件或文件夹或两者合并为一个文件的过程。在这种情况下,生成的文件不会被压缩。 压缩是一种将多个文件或文件夹或两者合并为一个文件并最终压缩生成的文件的方法。...存档不是压缩文件,但压缩文件可以是存档。 1. 使用 vim 编辑器 vim 不仅仅是一个编辑器。使用 vim,我们可以做很多事情。以下命令显示压缩存档文件的内容,而不对其进行解压缩。...因此,你还可以使用以下命令查看存档/压缩文件的内容: $ gunzip -c rumenz.tar.gz 9.使用zless命令 要使用 zless 命令查看存档/压缩文件的内容,只需执行以下操作: $...运行以下命令以使用less命令查看存档/压缩文件的内容: $ less rumenz.tar.gz

    2K00

    2021年大数据Hive(九):Hive的数据压缩

    DEFAULT .deflate 否 Gzip gzip DEFAULT .gz 否 bzip2 bzip2 bzip2 .bz2 是 LZO lzop LZO .lzo 否 LZ4 无 LZ4 .lz4 否 Snappy...无 Snappy .snappy 否 为了支持多种压缩/解压缩算法,Hadoop引入了编码/解码器,如下表所示 压缩格式 对应的编码/解码器 DEFLATE org.apache.hadoop.io.compress.DefaultCodec...org.apache.hadoop.io.compress.SnappyCodec 压缩性能的比较 压缩算法 原始文件大小 压缩文件大小 压缩速度 解压速度 gzip 8.3GB 1.8GB 17.5MB...9.5MB/s LZO 8.3GB 2.9GB 49.3MB/s 74.6MB/s On a single core of a Core i7 processor in 64-bit mode, Snappy...; 4、设置mapreduce最终数据输出压缩为块压缩 set mapreduce.output.fileoutputformat.compress.type=BLOCK; 5、测试一下输出结果是否是压缩文件

    92120

    Python 如何快速入门?

    在过去的几年里 Python 一直在快速增长,尤其是在去年跃居为排名第一的编程语言。...如何快速入门 Python? 学习任何一门编程语言,都是为了去实现一个个项目,来解决实际的问题。无论项目是大还是小,都关联着许多知识与技能。...那要如何从零开始,通过项目驱动来高效学习 Python 呢?啃厚厚的教材,或者看各种视频教程,显然都无法让自己开始动手做项目。你需要从实战项目开始学习。...硅谷前沿技术学习平台优达学城(Udacity)与硅谷名企工程师联合打造的 Python 入门认证项目进入中国,帮助你通过实战演练的方式在 8 周内快速入门 Python ,为后面的学习深造打下夯实的基础

    74660
    领券