首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Linux 上使用 Pigz 更快地压缩文件,真的快!

Pigz是一款快速压缩文件的工具,它能够使用多个CPU核心进行压缩,使得压缩速度得到了极大的提升。在本文中,我们将介绍如何在Linux上使用Pigz来更快地压缩文件。...安装Pigz 在开始使用Pigz之前,我们需要先安装它。在大多数Linux发行版Pigz可以通过包管理器来安装。...例如,在Ubuntu,可以使用以下命令来安装Pigz: sudo apt-get install pigz 输出: 图片 安装完成后,您可以使用以下命令来检查Pigz是否正确安装: pigz --version...输出: 图片 如果输出了Pigz的版本信息,说明Pigz已经成功安装。...压缩文件 要使用Pigz压缩文件,可以使用以下命令: pigz 文件名 例如,要压缩名为wljslmz.txt的文件,可以使用以下命令: pigz wljslmz.txt 输出: 图片 Pigz将会在同一目录下生成一个名为

1.3K40

从NT_NR数据库中提取子库

names.dmp和nodes.dmp两个文件很重要,是后续提取子库的基础 2 下载NCBI的TaxonKit软件,http://bioinf.shenwei.me/taxonkit/download/,linux...也可一并cp到~/.taxonkit下 cp taxdump/* ~/.taxonkit 3 下载NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux...采取这种方法提取的子库序列往往出乎意料的少,很可能是该库的accession与NT/NR库的accession不一致,前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库的...nucl_wgs.accession2taxid提取accession号 pigz -dc prot.accession2taxid.gz \ | csvtk grep -t -f taxid -P $...这种从NT库还原的nt.fa序列里面有很多重复的头文件,例如 所以使用的话,还需要写个perl把这些序列拆开,最终形成nt.anmail.fa.gz 8 如果直接想构建子库,那么没必要搞序列,直接运行

1.2K31
您找到你想要的搜索结果了吗?
是的
没有找到

从NT_NR数据库中提取子库

names.dmp和nodes.dmp两个文件很重要,是后续提取子库的基础 2下载NCBI的TaxonKit软件,http://bioinf.shenwei.me/taxonkit/download/,linux...也可一并cp到~/.taxonkit下 cp taxdump/* ~/.taxonkit 3下载NCBI的csvtk软件,http://bioinf.shenwei.me/csvtk/download/,linux...采取这种方法提取的子库序列往往出乎意料的少,很可能是该库的accession与NT/NR库的accession不一致,前者可能冗余更多,因此该方法可忽略,见仁见智吧,下面给个例子,例如: #从taxonomy数据库的...nucl_wgs.accession2taxid提取accession号 pigz -dc prot.accession2taxid.gz \ | csvtk grep -t -f taxid -P $...这种从NT库还原的nt.fa序列里面有很多重复的头文件,例如 所以使用的话,还需要写个perl把这些序列拆开,最终形成nt.anmail.fa.gz 8 如果直接想构建子库,那么没必要搞序列,直接运行

56240

RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗

CPM 的转化 获取基因有效长度的N种方 下面是他对我们b站转录组视频课程的详细笔记 本节概览: 1.在文章中找到 GEO accession number, 从NCBI获取数据SRR号 2.在linux...中使用prefetch命令根据SRR号下载SRA文件 3.使用fasterq-dump/fastq-dump命令将SRA文件转为FASTQ格式,pigz软件多线程压缩(可选) 4.使用fastqc和multiqc...进行测序数据的质控查看5.使用trim-galore去除低质量碱基和接头 承接上节RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建 一、从NCBI获取数据SRR号 数据的文章来源...进入NCBI官网搜索GSE154290,选择相应结果进入 找到Supplementary file 下的SRA Run Select选项 Common Fields下介绍了数据的基本信息,例如表的...fasterq-dump命令转化格式为fastq,之后用pigz软件多线程压缩为.gz文件节省空间(可略过),再用fastqc和multiqc进行原始数据的质控和质控汇总~ fasterq-dump/

4.4K45

Linux】关于Linux的权限

Linux的文件类型和后缀无关(后缀名可以作为提示,用户可以使用后缀区分文件类型),但是对linux来说区分文件和文件本身的后缀是无关的(但是gcc等工具对文件后缀可能有要求)。...开始之前,我们输入ll指令,来看看前面10个字符代表什么意思: 在linux,是通过ll显示的众多属性列的第一列的第一个字符来区分文件类型的。...则无法用ls等命令查看目录的文件内容....可写权限: 如果目录没有可写权限, 则无法在目录创建文件, 也无法在目录删除文件 所以这也是为什么系统规定目录的起始权限从777开始,所有的目录被创建出来,一般都要能够被进入 换句话来讲, 就是只要用户具有目录的写权限..., 用户就可以删除目录的文件, 而不论这个用户是否有这个文件的写权限。

7.2K20

压缩算法在构建部署的优化

Pzstd 通过 Pigz 的测试,我们就在想,是否 Zstd 这样优秀的算法也可以支持并行呢,在官方的 Repo ,我们十分惊喜地发现了一个“宝藏”。...压缩比的对比 压缩比的对比 Zstd 和 Pzstd 有一些优势,其中 Brotli 和 LZ4 由于支持的参数限制,比较难测试同级别压缩比下的速度,因此选择了压缩比稍低的参数,但是效率仍然距离 Pigz...在测试案例对比,时间耗时的顺序为 Pzstd < ISA-L < Pigz < LZ4 < Zstd < Brotli < Gzip (排名越靠前越好),其中压缩和解压缩的时间在整体的耗时上占比较大...,因此备选策略为 Pzstd、ISA-L、Pigz。...System: Host: ****** Kernel: ****** bits: 64 compiler: gcc v: 4.8.5 Console: tty 7 Distro: CentOS Linux

2.3K10
领券