【直播】我的基因组73:在IGV看看indel是啥样子

前面我们特意用scalpel软件来找indel,期待它会有一些出彩的表现,当然我还没来得及比较它找到的INDEL跟GATK等工具区别在哪里,不过我们先在IGV里面看看找出来的是什么吧。

【直播】我的基因组61:scalpel软件找indel

这里我不止一次推荐大家对数据处理结果进行可视化了,可视化能加深我们对处理步骤的理解。

先看看下面这个杂合的1碱基的缺失吧:

可以看到这个位置的测序深度是90X(有点过了,我的全基因组平均测序是45X),有32条reads在这个位置并没有缺失,有58条reads在这个位点缺失了一个碱基,所以它是一个杂合的Delete。它的前后还有两个杂合的SNP。

再看看一个杂合的4个碱基缺失情况:

这个delete处测序深度是22,虽然软件判定是一个杂合的缺失,但是只有3条reads是没有缺失的,另外的19条reads都是缺失了,而且它被标记着要过滤掉,这个就取决于软件的打分机制了。

再看看大片段缺失的情况:

这个不得了啦,一般来说,软件寻找INDEL的时候,不会考虑那些没有被reads覆盖的区域的,首先那些没有被reads覆盖的区域可能的原因多种多样,其次,既然没有被reads覆盖,那么长度肯定是超过reads长度了,也就是150个碱基,而INDEL的一般定义是50个碱基以下的缺失或者插入变异情况。这一个大片段缺失,我其实并不知道该如何解释,有点复杂。

再看看4个碱基的插入情况:

这个很简单了,缺失可以在reads里面显示一个小的空格,而插入呢,不管是插入多少个碱基,统统只能用大写字母I来表示。只有在IGV把鼠标放在具体的reads上面才会显示该reads比对详情。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-04-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

SDN应用路由算法实现工具之Networkx

SDN(Software Defined Networking)是一种新型的网络架构,通过集中式的控制平面管理数据层面的转发等操作。网络的连通性是最基础的需求,...

2669
来自专栏数据小魔方

think-cell chart系列7——堆积面积图

今天跟大家分享的是think-cell chart系列的第7篇——堆积面积图。 堆积面积图是很常用的反应数据变动趋势和内部结构的图表类型,在excel中制作也很...

3216
来自专栏高性能服务器开发

一个Sqrt函数引发的血案

好吧,我承认我标题党了,不过既然你来了,就认真看下去吧,保证你有收获。 我们平时经常会有一些数据运算的操作,需要调用sqrt,exp,abs等函数,那么时候你...

2775
来自专栏数据小魔方

R语言可视化——图表美化与套用主题(上)

ggplot函数所制作的图表默认设计风格虽然经过设计师的精雕细琢,但是并不是尽如人意。 毕竟在这个大众审美水平水平越来越高的时代里,企业中的各式报告也强调与企业...

2535
来自专栏CDA数据分析师

案例 | 5步掌握Python数据分析挖掘基础应用

许许多多的人都非常容易爱上Python这门语言。自从1991年诞生以来,Python现在已经成为最受欢迎的动态编程语言之一,尤其进入21世纪以来,Python在...

2009
来自专栏携程技术中心

干货 | ElasticSearch相关性打分机制

作者简介 孙咸伟,后端开发一枚,在携程技术中心市场营销研发部负责“携程运动”项目的开发和维护。 携程运动是携程旗下新业务,主要给用户提供羽毛球、游泳等运动项目的...

6168
来自专栏数据派THU

一文带你入门图论和网络分析(附Python代码)

本文从图的概念以及历史讲起,并介绍了一些必备的术语,随后引入了networkx库,并以一个航班信息数据集为例,带领读者完成了一些基本分析。

662
来自专栏小狼的世界

使用Numpy验证Google GRE的随机选择算法

最近在读《SRE Google运维解密》第20章提到数据中心内部服务器的负载均衡方法,文章对比了几种负载均衡的算法,其中随机选择算法,非常适合用 Numpy 模...

962
来自专栏数据小魔方

不等款柱形图(时间刻度实现)

今天要分享的图表仍然是昨天的不等款柱形图! ▽▼▽ 虽然最终制作出来的最终图表效果是相同的,但是制作理念和数据组织方式却截然不同,非常值得尝试! ●●●●● 数...

3236
来自专栏大数据挖掘DT机器学习

一个强化学习 Q-learning 算法的简明教程

本文是对 http://mnemstudio.org/path-finding-q-learning-tutorial.htm 的翻译,共分两部分,第一部分为...

4548

扫描关注云+社区