学IGV必看的初级教程

Integrative Genomics Viewer (IGV)作为一个高性能的可视化工具,可以交互式的察看综合的基因组相关数据,也友好的支持多种数据类型,自然是生信工作者必须使用的利器之一。官网也提供了很详细的使用讲解,这里仅是根据我目前需要学习摘录部分做的整理,后面有时间再做其他整理。

目录

1. 输入数据准备

2. 主界面

3. 数据导入

4. 察看序列比对结果

5. 察看可变剪切情况

6. 察看变异

7. 参考资料

1. 输入数据准备

IGV可以导入多种类型的数据,详见下文的数据导入介绍,此处主要说的是排序后的 bwa 的比对文件:bowtie2/BWA + samtools (samtools view>samtools sort>samtools index) 处理结果或RNA-seq的 Tophat结果;

2. 主界面

2.1 基础主界面

1.工具栏;

2.红框表示显示当前染色体的相应区域;

3.刻度线表示所处位置坐标;

4.tracks区域,也即 Alignment Track区;主要的信息区,通常会显示甲基化、基因表达、拷贝数、杂合性缺失(Loss of Heterozygosity)、突变等信息;对应的有三种显示形式:Collapsed、Squished 和 Expanded;

5. 特征显示区;蓝色粗线—外显子区域,细线内含子区域,空白—基因间隙;

6.列出 Track names,即导入的比对结果名称;

7.属性面板;

2.2 结果界面说明

(1) 处可手动输入想要察看的染色体/contigs/scaffolds编号,然后回车察看;

(2) 处是参考序列对应的核酸序列,其中四种核酸分别用不同的颜色表示:(A, C, G, T),下面为对应的翻译的氨基酸序列,甲硫氨酸(M)用绿色表示,终止密码子(*)红色星号表示;当右上角的标尺足够大时此区域才会显示;

(3) 处不同颜色条表示排序方式,鼠标停留在此处右键选择 <Color alignments by> 可选取不同的颜色形式;同时每一个长条对应的序列和比对信息可以鼠标右键选择来拷贝;每一个长条都是由一系列的核酸序列组成,可通行 <Show all bases> 来显示;比对的reads长条也可通过成对的形式显示;

(4) 处鼠标停留时会显示此处碱基统计信息,例如在此处显示为红蓝色,红色是T,蓝色是C,红色方块大于蓝色,表示所有比对到这一位置的序列中这一位点碱基是T的序列大于C的,即C可能是突变;当导入数据为比对的bam数据时,此处所在区域为 Coverage Track

3. 数据导入

当数据通过 <File> 导入时,IGV通过导入文件的扩展名来确认数据格式 (file format),进而确定数据类型 (data type),再确定数据展现的 Track 形式 (track default display options);如下所示(此默认值均可修改):

4. 察看序列比对结果

1.可通过 View >>Preferences >>Alignments 面板设置相关参数;

2.在 Track 区不进行 Color alignments by 的情况下,alignments 只有亮灰和白色两种长条,其中白色的比对质量为零 (mapping quality equal to zero);

3.插入:用紫色的 I 或红色的 I (当插入的碱基数多余预设的阀值时)表示;鼠标停留察看详细的插入碱基情况;

4.缺失:黑条表示;

5.Sort alignments by 可对Track区域进行排序,如想返回最初结果则选择 Re-pack alignments 即可;

6.默认情况下 Track Alignments 区以左图紧凑的单个 reads 的形式展示,通过 View as pairs 可成对显示,且中间以细线连接 (右图);

在左图中按住 Ctrl 键鼠标左击某一个长条 (a read),将以相同的彩色颜色显示出与其配对 (paired mate) 的另一条 read。黑色的表示没有与之配对的另一条read。选中一条 read 后右键 Go to Mate 将会跳转到与其配对 (paired mate) 的另一条 read。If the paired reads have a large insert size, the paired mate will not be highlighted. 右键选择 Clear Selections 来清除所有选择的reads。同时注意到不同reads会用不同的颜色表示 (蓝色:插入大小小于期望值;红色:插入大小大于期望值;绿色、青色、深蓝色:倒置、重复、易位事件),更多详情见:Interpreting Color by Insert Size 和 Interpreting Color by Pair Orientation;低分辨率下在 Track Alignments 区域选择 Color alignments by >> insert size and pair orientation 时比对的reads会显示不同的颜色 (Red have larger than expected inferred sizes, and therefore indicate possible deletions; Blue have smaller than expected inferred sizes, and therefore indicate insertions;实心灰代表比对质量比较高的测序片段,空心灰代表比对到此处的测序片段也可以比对到其他位点。),高分辨率下,可以精确到每个位点的碱基类型:当比对序列上与参考基因组相同的超过80%时,用灰色表示;否则用红色-T,蓝色-C,绿色-A,橙色-G;Translocations on the same chromosome can be detected by color-coding for pair orientation, whereas translocations between two chromosomes can be detected by coloring by insert size.

7.Paired-end alignment tracks 时 (View as pairs),右键选择 View mate region in split screen 可分隔显示;可实现多个分隔;在下图处右键选择 Switch to standard view 或鼠标左键双击可返回单个分区;

5. 察看可变剪切情况

1.Loaded junctions data in the standard .bed format (例如TopHat’s “junctions.bed”等输出文件);

1234567

|-- accepted_hits.bam|-- accepted_hits.bam.bai|-- deletions.bed|-- insertions.bed|-- junctions.bed|-- unmapped.bam`-- unmapped.bam.bai

6. 察看变异

6.1 Mutation Files:MAF (mutation annotation format) and MUT (mutation)文件;

6.2 VCF Files

1.Each bar across the top of the plot shows the allele fraction for a single locus.

2.The genotypes for each locus in each sample. Dark blue = heterozygous, Cyan = homozygous variant, Grey = reference. Filtered entries are transparent.

7. 参考资料

IGV应用教程

原文许多超链接内容(下划线部分)由于外链原因无法点击,同时图片清晰度可能不够高,因此推荐阅读原文

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2018-02-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏macOS 开发学习

cocos2d-objc 3.0+ 游戏开发学习手册(二): CCNode 了解

在cocos2d中,CCNode是最基本的显示对象. 在3.0后的新版本中CCNode继承自CCResponder类,可以响应用户的交互事件(点击,触摸等),也...

652
来自专栏GIS讲堂

Arcgis for JS扩展GraphicLayer实现区域对象的聚类统计与展示

分省市雨量站的数目通过统计表的形式在页面端展示,位置根据XY坐标信息将雨量站标绘在图上。

672
来自专栏林德熙的博客

matlab 画图

本文讲如何使用 matlab 画图。 本文包括:折线图的 x轴和y轴、标题、图例 柱状图填充图案

432
来自专栏阮一峰的网络日志

中文字体网页开发指南

字体的选择,是网页开发的关键因素之一。 合适的字体,对网页的美观度(或可读性)有着举足轻重的影响。 ? ? ? 但是,相比英文字体,中文字体的网页开发有着极大的...

2494
来自专栏GIS讲堂

Geoserver2.11矢量切片与OL3中的调用展示

GIS的底图一直使用金字塔技术进行切图,使用户能够快速访问指定级别的地图或者影像。但是切图本身是一张图片,无法进行交互。于是又引入了矢量图层用来显示矢量点线面,...

783
来自专栏移动开发之家

Android MP3录制,波形显示,音频权限兼容与播放

</p> Demo :https://github.com/CarGuo/RecordWave

1012
来自专栏老司机的简书

老司机带你走进Core Animation 之CAAnimation

开玩笑的,前段时间ipv6被拒啊,超级悲剧的,前后弄了好久,然后需求啊什么的又超多,所以写好的东西也没有时间整理。不过既然我现在回来了,那么这将是一个井喷的时节...

872
来自专栏谦谦君子修罗刀

贝塞尔曲线之爱琴海 -- 定不负相思意

前言: 一个人有多不正经,就有多深情。一个程序员有多闷,就代表ta有多骚。 我不等山无棱,不等夏雨雪,不等天地合。因为即使江水为竭,即使冬雷震震,我都在你一...

34210
来自专栏木子昭的博客

机器学习三剑客之Matplotlab绘制条形图直方图饼图

? Matplotlib 是Python 2D绘图领域的基础套件,它让使用者将数据图形化,并提供多样化的输出格式。这里将会以四个小案例探索Matplotli...

3106
来自专栏互联网杂技

深入理解视觉格式化模型

“理论不懂就实践,实践不会就学理论”,非常赞同bluedavy的这句话。实践过程中经常会遇到某个属性的使用,浏览器渲染效果与预期效果不符,虽然通过死记硬背能避免...

3419

扫码关注云+社区