【直播】我的基因组73:在IGV看看indel是啥样子

前面我们特意用scalpel软件来找indel,期待它会有一些出彩的表现,当然我还没来得及比较它找到的INDEL跟GATK等工具区别在哪里,不过我们先在IGV里面看看找出来的是什么吧。

【直播】我的基因组61:scalpel软件找indel

这里我不止一次推荐大家对数据处理结果进行可视化了,可视化能加深我们对处理步骤的理解。

先看看下面这个杂合的1碱基的缺失吧:

可以看到这个位置的测序深度是90X(有点过了,我的全基因组平均测序是45X),有32条reads在这个位置并没有缺失,有58条reads在这个位点缺失了一个碱基,所以它是一个杂合的Delete。它的前后还有两个杂合的SNP。

再看看一个杂合的4个碱基缺失情况:

这个delete处测序深度是22,虽然软件判定是一个杂合的缺失,但是只有3条reads是没有缺失的,另外的19条reads都是缺失了,而且它被标记着要过滤掉,这个就取决于软件的打分机制了。

再看看大片段缺失的情况:

这个不得了啦,一般来说,软件寻找INDEL的时候,不会考虑那些没有被reads覆盖的区域的,首先那些没有被reads覆盖的区域可能的原因多种多样,其次,既然没有被reads覆盖,那么长度肯定是超过reads长度了,也就是150个碱基,而INDEL的一般定义是50个碱基以下的缺失或者插入变异情况。这一个大片段缺失,我其实并不知道该如何解释,有点复杂。

再看看4个碱基的插入情况:

这个很简单了,缺失可以在reads里面显示一个小的空格,而插入呢,不管是插入多少个碱基,统统只能用大写字母I来表示。只有在IGV把鼠标放在具体的reads上面才会显示该reads比对详情。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-04-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯云TStack专栏

《 大话 Ceph 》 之 CRUSH 那点事儿

《大话 Ceph 》系列文章通过通俗易懂的语言并结合基础实验,用最简单的描述来讲解 Ceph 中的重要概念。让读者对分布式存储系统有一个清晰的理解。

2.2K5
来自专栏量化投资与机器学习

【深度学习量化投资】RNNs在股票价格预测的应用基于Keras

前言 RNN和LSTMs在时态数据上表现特别好,这就是为什么他们在语音识别上是有效的。我们通过前25天的开高收低价格,去预测下一时刻的前收盘价。每个时间序列通过...

1.5K6
来自专栏图形学与OpenGL

Endnote的Output Style文件

我使用Endnote已经有一些日子,苦于Endnote无法输出符合中文期刊要求的参考文献格式,用得不多. 这次写论文想试一下,便在研究英文Output Styl...

1192
来自专栏生信技能树

探究某个基因的外显子覆盖度情况【直播】我的基因组87

一般情况下,我们得到了测序reads在基因组的比对情况文件bam格式的,里面的信息非常多,如果我想特定的查看某个基因的情况,那么我们可以选择IGV等可视化工具,...

3417
来自专栏琦小虾的Binary

OpenCV像素点邻域遍历效率比较,以及访问像素点的几种方法

OpenCV像素点邻域遍历效率比较,以及访问像素点的几种方法 前言: 以前笔者在项目中经常使用到OpenCV的算法,而大部分OpenCV的算法都需要进行遍历操作...

47210
来自专栏人工智能LeadAI

用TensorFlow的Linear/DNNRegrressor预测数据

今天要处理的问题对于一个只学了线性回归的机器学习初学者来说还是比较棘手——通过已知的几组数据预测一组数据。用excel看了下,关系不是很明显,平方,log都不是...

931
来自专栏腾讯AlloyTeam的专栏

教你用 webgl 快速创建一个小世界

Webgl的魅力在于可以创造一个自己的3D世界,但相比较canvas2D来说,除了物体的移动旋转变换完全依赖矩阵增加了复杂度,就连生成一个物体都变得很复杂……这...

1.7K0
来自专栏大数据

不规范数据处理?字符串中所有数值汇总求和

感 谢 感谢每一个朋友的关注与支持,感谢所有的不离不弃,一路同行! 关 注 导读 我们在工作中偶尔会遇到一些不规范的数据,而且因为工作的需要我们还需要对这些不规...

2016
来自专栏生信技能树

比对NR库看看物种分布【直播】我的基因组88

前面我提前了我的基因组测序数据里面的未成功比对到人类基因组上面的那些fastq序列,也用了软件把它们组装成fasta序列,这些序列的功能是未知的,可以通过比对到...

5078
来自专栏计算机视觉战队

Deep Hash(深度哈希算法)

哈希的简单介绍: 用一个比喻来说明什么是哈希算法:假设有N只小猪,它们的体重各不相同,一开始我们把它们放在一个猪圈里面。如果想寻找其中某只小猪,只能一个一个的...

4686

扫码关注云+社区