专栏首页生信修炼手册使用picard评估文库复杂度

使用picard评估文库复杂度

文库复杂度对应的英文如下

Library Complexity

表示的是文库中unique的分子数目,unique分子数目越多,文库复杂度越高。在数据分析中,重复序列会对下游分析造成影响,在snp calling, peak caling等分析前都需要去除文库中的重复序列。

只有一个复杂度高的文库,才能确保挖掘出更多有效的信息,所以在数据分析中,需要对文库的复杂度进行评估。本文主要介绍下通过picard这个工具来评估文库复杂度,用法如下

java -jar picard.jar \
EstimateLibraryComplexity \
I=input.bam \
O=lib_complex_metrics.txt

基本用法非常简单,只需要指定输入输出即可,输入文件为比对产生的bam文件,输出文件记录了文库复杂度信息,其内容如下

为了方便展示,这里我截取了部分重点内容并进行了转置,其中有3个指标识别需要重点关注

  1. READ_PAIRS_EXAMINED, bam文件中包含的序列数,这里以fragment为单位,默认会根据MAPQ值对bam文件中的reads进行过滤,这里统计的是过滤之后的序列数
  2. READ_PAIR_DUPLICATES,bam文件中包含的重复序列数
  3. ESTIMATED_LIBRARY_SIZE, 预测出来的文库中unique分子的数目

通过序列数和重复序列数,有对应的公式来计算unique分子数目,公式如下

其中N表示bam文件中的序列数,C表示bam文件中的unique序列数,用序列数减去重复序列数即可得到,N就是文库中unique分子数目,即library size。

本文分享自微信公众号 - 生信修炼手册(shengxinxiulian),作者:lzyg

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 详解人类基因在不同数据库中的ID

    对于人类的基因而言,不同数据库提供了不同的命名方式。对于初学者而言,非常容易搞混淆。今天我们就来理一下,常见的基因命名方式。

    生信修炼手册
  • DARNED:RNA编辑位点数据库

    DARNED数据库收录了human等多个物种的RNA编辑位点信息,除了最常见的A->I类型的RNA编辑外,还收录了部分C->U的RNA编辑位点,网址如下

    生信修炼手册
  • GWAS样本量不够怎么办,meta分析了解一下

    对于GWAS分析而言,增加样本量是提高检验效能的最直接有效的方式。目前常规GWAS项目的样本量约为1000 cases vs 1000 controls,这样的...

    生信修炼手册
  • Mybatis第二篇| CRUD,这才是程序员入门第一课

    增删改查(CRUD)是程序员必会的技能,我们大部分的时间也都是消耗在增删改查上,当然我们不能只做一个只会CRUD的程序员,当我们掌握并且熟练了CRUD后,我们可...

    Python进击者
  • metal3-io项目

    说明:Metal³项目(发音:Metal Kubed)的存在是为了为Kubernetes提供裸机主机管理。Metal³的主要组件包括baremetal-oper...

    CNCF
  • 活动 | 深圳 Gopher Meetup 分享交流

    2017年6月17日,深圳大雨,这一天下午13:00-18:00在科技园举办深圳 Gopher 的第一次Meetup。我也是第一次作为Gopher Meetup...

    飞雪无情
  • 彻底理解虚拟内存:从一个demo看free/ps/top内存含义

    笔者团队发现现网服务负载即将达到瓶颈,但cpu利用率并未达到瓶颈,基于充分利用机器资源的考量,研发同学提出:“降低nginx worker数,腾出一部分内存,随...

    Radar3
  • Spring 基于 XML 的 IOC

      依赖注入(Dependency Injection)是 Martin Fowler 在 2004 年提出的关于 “控制反转” 的解释。Martin Fowl...

    Demo_Null
  • 内建DNS服务器--BIND

    参考 BIND 官网:http://www.isc.org/downloads/bind/ 1、系统环境说明 [root@clsn6 ~]# cat /etc/...

    惨绿少年
  • 前端之jQuery

    jQuery对象就是通过jQuery包装DOM对象后产生的对象。jQuery对象是 jQuery独有的。如果一个对象是 jQuery对象,那么它就可以使用jQu...

    GH

扫码关注云+社区

领取腾讯云代金券