使用IGV看序列比对情况

本文从以下五个方面介绍了可视化序列比对数据和相关的tracks:

  • 文件格式:推荐的是BAM/SAM,其他格式,并且需要进行sorting&indexing
  • Read 覆盖率:整体视图,默认的覆盖率视图,和扩展覆盖率视图
  • 序列比对track:颜色、透明度、插入、缺失和排序
  • PE序列比对:将reads以pairs形式和颜色来区分,同时可以分为几个屏幕看。

文件格式

IGV推荐使用格式是:BAM以及SAM格式。

除了BAM,GOBY、VCF、PSL、BED、TDF等格式IGV也支持。

Sort和Index

BAM文件在载入IGV前,需要进行sort 和index。Index会生成一个以“.fai”结尾的辅助文件,这个文件会根据文件名自动关联序列比对数据(.bam),导入IGV中。

  • 序列比对数据需要以.bam扩展名结尾;
  • 在进行index时,文件名必须一致,index文件也必须在同一个文件夹下。 比如:test_xyz.bam文件的index文件名应该是test_xyz.bam.bai,或者是test_xyz.bai。
  • 这两步骤可以用samtools或Picard软件进行。

Tracks

载入bam文件后会产生3个相关的tracks:

  • Alignment track :显示每个的reads的比对情况
  • Coverage track:显示覆盖率和测序深度
  • Splice Junction Track:提供一个可选的横跨剪切位点(spanning splice junctions)的reads视图。

一般情况下,前两个tracks会自动出现。这些设置可以通过右键进行修改。

Coverage Track

默认情况下,IGV能动态计算和显示比对文件的覆盖率和测序深度。当IGV窗口放大到reads 可视化阈值大小(默认为30KB)时,这个track会以灰色条形图显示每个位点的测序深度。如果某核苷酸与参考序列不同(超过20%reads)时,IGV会标出不同的颜色。

即:A→绿色;C→蓝色;G→橙色;T→红色。

  • 将鼠标悬停在你需要查看的位点处可以看到详细的信息,右键可以复制。

覆盖率数据(TDF)

可用igvtools将BAM文件转化为TDF格式,这个文件是专门显示覆盖率

TDF文件是BAD文件的精简版,当只需要看覆盖率数据时,可用igvtools工具进行转换;方便快速查看。

Alignment Track

当IGV窗口放大到30KB(默认)时,就会显示出各个reads的情况。

  • 当窗口放大到一定程度时,IGV的窗口中心会出现一条线,再继续放大,中心线会变为两条,刚好可以框住一个碱基。

结构变异(Structural Variants)

IGV使用颜色和其他的标记来显示变异:SNP、SV、异倍体(aneuploidy)。

IGV使用reads透明度来表示其质量。

  • 灰色:和参考基因能比对上的reads;
  • 紫色 I:插入;(鼠标悬空在此处能显示插入的碱基信息)
  • 黑色横线(—):缺失;
  • 注意:那些透明或者白色的reads有着亮灰色边框的其比对质量(MQ)为0.

Paired-end 比对

对于PE比对,igv可通过右键选择将reads以成对的方式展示。(如下图)

用户可以将需要标记的reads用紫色标记(1),而不同于预期的将会同(3)一样进行标记。

  • Ctrl+鼠标单击(Mac:command+click)将paired reads用相同的颜色标记其轮廓,每对颜色都是不一样的。注:黑色外框的reads则该reads没有mate。
  • 而Ctrl+鼠标单击(Mac:command+click)任意的一个read都可以去掉这个轮廓。
  • 单击右键,选择Go to mate region可以找到PE中的另一条read。
  • 如果这对reads的插入片段大小较大,则标记一条read时,其另一条read将不会被标记。
  • 停留在一个read上或者单击它,可以看到这条read的信息,包括它paired的另一条read。

在PE比对中,还可以通过右击一个read,选择View mate region in split screen,分屏查看paired mate。(注:若这个read没有mapped mate,则这个选项为灰色)。双击窗口顶端的位点栏,即可恢复正常的单屏视图。

Interpreting Color by Insert size

IGV用颜色来标记异常的插入片段大小的reads,这个只用DNA比对(不适用于RNA-Seq)。

默认的颜色标记规则:如图

  • 红色:插入片段大小大于预期值(这里可能有缺失)
  • 蓝色:插入片段大小小于预期值(这里可能存在有插入)
  • 不同颜色显示PE reads中其mate可在其他染色体上找到(此处可能为染色体间重组)

Interpreting Color by Pair Orientation

  • inversions
  • duplications
  • Translocations

本文简单介绍了使用igv查看序列比对的情况,还有其他模式如Bisulfite Mode,详细可看原文网页(http://software.broadinstitute.org/software/igv/book/export/html/37)。期待大家的交流学习哇。

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-07-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ionic3+

【组件篇】ionic3均分列等宽高图像显示(下)

那就是它依赖一个addImage(用于添加的仿按钮图像),如果我没有这个东西,逻辑上是不是就不能用了?是的!那为了使得这个组件能更通用些,改造一下:

733
来自专栏我的小碗汤

极致简洁的markdown编辑神器

Markdown 其实向来是文字爱好者和码农们的小众需求,市面上也涌现出了形形色色的 Markdown 编辑器,Mou、Typed、Ulysess、Macdow...

1815
来自专栏张戈的专栏

张戈博客成功启用移动端主题:Mobile Pack

建站以来,总是忙于 PC 端主题的折腾,移动端主题只是偷懒的使用了 WPtouch 插件。现在 PC 端主题已完善七七八八了,是时候折腾下移动端自适应主题了,毕...

3616
来自专栏向治洪

android图片加载库Glide

什么是Glide? Glide是一个加载图片的库,作者是bumptech,它是在泰国举行的google 开发者论坛上google为我们介绍的,这个库被广泛的...

3416
来自专栏葡萄城控件技术团队

【图解】Web前端实现类似Excel的电子表格

本文将通过图解的方式,使用纯前端表格控件 SpreadJS 来一步一步实现在线的电子表格产品(例如可构建Office 365 Excel产品、Google的在线...

1.3K6
来自专栏陈满iOS

[iOS学习笔记]·第三方网络图片处理框架:SDWebImage(官方文档翻译篇)

该库提供了具有缓存支持的异步图像下载器。为方便起见,我们为UI元素例如UIImageView,UIButton,MKAnnotationView等类添加了cat...

2532
来自专栏林德熙的博客

win10 uwp 让焦点在点击在页面空白处时回到textbox中

在网上 有一个大神问我这样的问题:在做UWP的项目,怎么能让焦点在点击在页面空白处时回到textbox中? 虽然我的小伙伴认为他这是一个 xy 问题,但是我还是...

881
来自专栏c#开发者

datagrid资料+ by iCeSnaker - Program rhapsody

datagrid资料+ by iCeSnaker - Program rhapsody 关于datagrid的打印 http://www.chinaaspx.c...

3529
来自专栏码神联盟

【原创】说好的暴雨呢,搁哪呢?还能不能 雨~露~均~沾?

不是说下大雨吗?玩儿呐?搁哪呢?大雨搁哪呢?下丢啦?哗啦到海里去啦?让五娃给吞啦?南方整的那老大,看不起副中心咋的?还能不能 雨~露~均~沾~?你说我小...

3496
来自专栏施炯的IoT开发专栏

《101 Windows Phone 7 Apps》读书笔记-Weight Tracker

课程内容 Ø Charts & Graphs     你平时关注自己的体重吗?Weight Tracker使得你可以随时跟踪自己的体重,并且提供几种体重发展趋...

1898

扫码关注云+社区