【直播】我的基因组73:在IGV看看indel是啥样子

前面我们特意用scalpel软件来找indel,期待它会有一些出彩的表现,当然我还没来得及比较它找到的INDEL跟GATK等工具区别在哪里,不过我们先在IGV里面看看找出来的是什么吧。

【直播】我的基因组61:scalpel软件找indel

这里我不止一次推荐大家对数据处理结果进行可视化了,可视化能加深我们对处理步骤的理解。

先看看下面这个杂合的1碱基的缺失吧:

可以看到这个位置的测序深度是90X(有点过了,我的全基因组平均测序是45X),有32条reads在这个位置并没有缺失,有58条reads在这个位点缺失了一个碱基,所以它是一个杂合的Delete。它的前后还有两个杂合的SNP。

再看看一个杂合的4个碱基缺失情况:

这个delete处测序深度是22,虽然软件判定是一个杂合的缺失,但是只有3条reads是没有缺失的,另外的19条reads都是缺失了,而且它被标记着要过滤掉,这个就取决于软件的打分机制了。

再看看大片段缺失的情况:

这个不得了啦,一般来说,软件寻找INDEL的时候,不会考虑那些没有被reads覆盖的区域的,首先那些没有被reads覆盖的区域可能的原因多种多样,其次,既然没有被reads覆盖,那么长度肯定是超过reads长度了,也就是150个碱基,而INDEL的一般定义是50个碱基以下的缺失或者插入变异情况。这一个大片段缺失,我其实并不知道该如何解释,有点复杂。

再看看4个碱基的插入情况:

这个很简单了,缺失可以在reads里面显示一个小的空格,而插入呢,不管是插入多少个碱基,统统只能用大写字母I来表示。只有在IGV把鼠标放在具体的reads上面才会显示该reads比对详情。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-04-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

MXNet设计笔记之:深度学习的编程模式比较

1793
来自专栏mathor

逻辑代数

1005
来自专栏生信宝典

R语言学习 - 箱线图(小提琴图、抖动图、区域散点图)

箱线图 箱线图是能同时反映数据统计量和整体分布,又很漂亮的展示图。在2014年的Nature Method上有2篇Correspondence论述了使用箱线图的...

43810
来自专栏瓜大三哥

直方图操作(二)

直方图操作(二)之统计电路 在实际的图像中,连续的像素点灰度值为相同值的情况非常常见,如果每来一个像素都对双口RAM进行一次寻址和写操作,显然降低了统计效率而提...

1897
来自专栏偏前端工程师的驿站

语义化HTML:i、b、em和strong标签

一、前言                             在HTML4.1中i和b作为表象标签分别表示斜体和粗体样式,而强调样式与内容分离的XHTML中...

1869
来自专栏数据科学与人工智能

【Python环境】可爱的 Python: 自然语言工具包入门

鄙人并非见多识广,虽然写过很多关于 文本处理 方面的东西(例如,一本书),但是,对我来说, 语言处理(linguistic processing) 是一个相对新...

2958
来自专栏灯塔大数据

技术 | Python从零开始系列连载(二十五)

为了解答大家学习Python时遇到各种常见问题,小灯塔特地整理了一系列从零开始的入门到熟练的系列连载,每周五准时推出,欢迎大家学积极学习转载~

662
来自专栏落影的专栏

程序员进阶之算法练习(十四)

前言 坚持做算法练习对开发的好处是抽象能力变强,拿到一个需求能很快对其进行抽象,然后再用学过的设计模式相关知识进行整理,最后用代码实现。 最大的好处在于:对...

3347
来自专栏ATYUN订阅号

【学术】不懂神经网络?不怕,一文教你用JavaScript构建神经网络

AiTechYun 编辑:xiaoshan.xiang 本文的内容并不是关于神经网络的深度教程,在这里既不会深入研究输入层、激活函数的内部原理,也不会教你如何使...

3234
来自专栏养码场

SQL 数据库查询的优化工具及实用

本文主要是对数据库查询优化器的一个综述,包括查询优化器分类、查询优化器执行过程和CBO框架Calcite。

852

扫码关注云+社区