使用IGV看序列比对情况

本文从以下五个方面介绍了可视化序列比对数据和相关的tracks:

  • 文件格式:推荐的是BAM/SAM,其他格式,并且需要进行sorting&indexing
  • Read 覆盖率:整体视图,默认的覆盖率视图,和扩展覆盖率视图
  • 序列比对track:颜色、透明度、插入、缺失和排序
  • PE序列比对:将reads以pairs形式和颜色来区分,同时可以分为几个屏幕看。

文件格式

IGV推荐使用格式是:BAM以及SAM格式。

除了BAM,GOBY、VCF、PSL、BED、TDF等格式IGV也支持。

Sort和Index

BAM文件在载入IGV前,需要进行sort 和index。Index会生成一个以“.fai”结尾的辅助文件,这个文件会根据文件名自动关联序列比对数据(.bam),导入IGV中。

  • 序列比对数据需要以.bam扩展名结尾;
  • 在进行index时,文件名必须一致,index文件也必须在同一个文件夹下。 比如:test_xyz.bam文件的index文件名应该是test_xyz.bam.bai,或者是test_xyz.bai。
  • 这两步骤可以用samtools或Picard软件进行。

Tracks

载入bam文件后会产生3个相关的tracks:

  • Alignment track :显示每个的reads的比对情况
  • Coverage track:显示覆盖率和测序深度
  • Splice Junction Track:提供一个可选的横跨剪切位点(spanning splice junctions)的reads视图。

一般情况下,前两个tracks会自动出现。这些设置可以通过右键进行修改。

Coverage Track

默认情况下,IGV能动态计算和显示比对文件的覆盖率和测序深度。当IGV窗口放大到reads 可视化阈值大小(默认为30KB)时,这个track会以灰色条形图显示每个位点的测序深度。如果某核苷酸与参考序列不同(超过20%reads)时,IGV会标出不同的颜色。

即:A→绿色;C→蓝色;G→橙色;T→红色。

  • 将鼠标悬停在你需要查看的位点处可以看到详细的信息,右键可以复制。

覆盖率数据(TDF)

可用igvtools将BAM文件转化为TDF格式,这个文件是专门显示覆盖率

TDF文件是BAD文件的精简版,当只需要看覆盖率数据时,可用igvtools工具进行转换;方便快速查看。

Alignment Track

当IGV窗口放大到30KB(默认)时,就会显示出各个reads的情况。

  • 当窗口放大到一定程度时,IGV的窗口中心会出现一条线,再继续放大,中心线会变为两条,刚好可以框住一个碱基。

结构变异(Structural Variants)

IGV使用颜色和其他的标记来显示变异:SNP、SV、异倍体(aneuploidy)。

IGV使用reads透明度来表示其质量。

  • 灰色:和参考基因能比对上的reads;
  • 紫色 I:插入;(鼠标悬空在此处能显示插入的碱基信息)
  • 黑色横线(—):缺失;
  • 注意:那些透明或者白色的reads有着亮灰色边框的其比对质量(MQ)为0.

Paired-end 比对

对于PE比对,igv可通过右键选择将reads以成对的方式展示。(如下图)

用户可以将需要标记的reads用紫色标记(1),而不同于预期的将会同(3)一样进行标记。

  • Ctrl+鼠标单击(Mac:command+click)将paired reads用相同的颜色标记其轮廓,每对颜色都是不一样的。注:黑色外框的reads则该reads没有mate。
  • 而Ctrl+鼠标单击(Mac:command+click)任意的一个read都可以去掉这个轮廓。
  • 单击右键,选择Go to mate region可以找到PE中的另一条read。
  • 如果这对reads的插入片段大小较大,则标记一条read时,其另一条read将不会被标记。
  • 停留在一个read上或者单击它,可以看到这条read的信息,包括它paired的另一条read。

在PE比对中,还可以通过右击一个read,选择View mate region in split screen,分屏查看paired mate。(注:若这个read没有mapped mate,则这个选项为灰色)。双击窗口顶端的位点栏,即可恢复正常的单屏视图。

Interpreting Color by Insert size

IGV用颜色来标记异常的插入片段大小的reads,这个只用DNA比对(不适用于RNA-Seq)。

默认的颜色标记规则:如图

  • 红色:插入片段大小大于预期值(这里可能有缺失)
  • 蓝色:插入片段大小小于预期值(这里可能存在有插入)
  • 不同颜色显示PE reads中其mate可在其他染色体上找到(此处可能为染色体间重组)

Interpreting Color by Pair Orientation

  • inversions
  • duplications
  • Translocations

本文简单介绍了使用igv查看序列比对的情况,还有其他模式如Bisulfite Mode,详细可看原文网页(http://software.broadinstitute.org/software/igv/book/export/html/37)。期待大家的交流学习哇。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-07-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏编程

一行JS代码实现翻翻卡效果

本文章是由源码时代H5前端讲师分享:一行JS代码实现翻翻卡效果,希望对大家有一定帮助。 实现步骤 准备2张图片,一个在上一个在下 上方的图片不动,下方的图片先翻...

1718
来自专栏向治洪

Android仿网易云音乐播放界面

概述 网易云音乐是一款非常优秀的音乐播放器,尤其是播放界面,使用唱盘机风格,显得格外古典优雅。这里抛砖引玉,原文地址:http://www.jianshu.co...

3096
来自专栏Android小菜鸡

Android自定义View——手写签批

  接到一个领导批示保留原笔迹的功能,类似于绘画板,用户打开后可以绘制,点击完成后以图片的形式保存在本地,并且显示绘制后图片,上传服务器,达到保留原笔迹的目的。...

763
来自专栏vue学习

13、优化轮播图组件与vue深度处理器

(1)这里我们要用到vue的深度作用选择器,关于深度作用选择其详情看一看官网介绍:https://vue-loader-v14.vuejs.org/zh-cn/...

832
来自专栏林德熙的博客

WPF 使用 SharpDx 异步渲染 使用方法绑定渲染为什么空白等待画完异步渲染多线程渲染

本文告诉大家如何通过 SharpDx 进行异步渲染,但是因为在 WPF 是需要使用 D3DImage 画出来,所以渲染只是画出图片,最后的显示还是需要 WPF ...

1143
来自专栏wym

见缝插针游戏--实现转圈

691
来自专栏程序员互动联盟

小菜学Chromium之OpenGL学习之二

在这个教程里,我们一起来玩第一个OpenGL程序.它将显示一个空的OpenGL窗口,可以在窗口和全屏模式下切换,按ESC退出.它是我们以后应用程序的框架. 在C...

2726
来自专栏hbbliyong

highcharts 时间少8小时问题

Highcharts 中默认开启了UTC(世界标准时间),由于中国所在时区为+8,所以经过 Highcharts 的处理后会减去8个小时。 如果不想使用 UTC...

3196
来自专栏何俊林

流媒体解码及H.264编码推流

2365
来自专栏Android群英传

Android Vector曲折的兼容之路

1043

扫码关注云+社区