话说上次更新完在线基因组浏览器的推文,小伙伴们都很感兴趣。
这次我们一起科研论文中常用到的桌面级基因组浏览器 IGV,优势在于可以离线使用,方便大家直接查看本地文件,而且渲染速度相较在线基因组浏览器网站要快不少。
这篇推文同样以实战的形式教大家快速上手。
软件下载
IGV 官网下载:
http://software.broadinstitute.org/software/igv/download
这里以下载预装 Java 的 Windows 版本 IGV 为例。
由于大部分数据是通过服务器跑出的结果,所以也有小伙伴有在 Linux 服务器端使用的需求。这里推荐几种方式:
建议最好安装在固态硬盘所在分区,提高加载速度。
如果没有在桌面找到 IGV 软件,按住 Win
键,搜索 igv
可以找到并运行
IGV 有下载文件的需求,所以要通过网络访问权限
1
数据载入
为了方便介绍功能,我们需要先下载几个测试数据:
测试数据来自人肝脏的 DNaseq 数据,分别为bigbed 文件与 bigwig 文件:
bigbed 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF812QNX%5Fpeaks%5Fmm10%2EbigBed
bigwig 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF705ESF%5Fread%2Ddepth%5Fnormalized%5Fsignal%5Fmm10%2EbigWig
想了解更多基因组相关文件格式:https://blog.csdn.net/u011262253/article/details/109367884
载入数据:
成功载入数据
切换到其中一个染色体:
2
软件面板
这里分五大部分来介绍:
工具栏
从左到右依次为划分为三个小工具:
参考基因组工具
a. 选择参考基因组物种及版本,如果没有本地版本,需要联网下载
b. 选择染色体编号
c. 搜索染色体区间,格式如图所示,最常用的功能还是输入感兴趣的基因,直接跳转到对应的位置
视图操作工具
依次为主页面,前一步,后一步,刷新,定义区域,Trace适屏,弹出信息显示
缩放工具
用于控制整个视图的缩放比例,快捷键
轨迹信息栏
右键可以打开菜单,进一步修改,后面详细来研究。
基因组窗口
上部分为整条染色体,点击即可跳转该位置
下半部分为目前染色体可见部分对于的染色体位置,用刻度线标识,单位为碱基数。
轨迹窗口
每一行代表一个样本的 Trace,右键可以打开菜单,进一步修改,后面详细来研究。
基因窗口
显示基因的特征区域,可以与 Trace 面板配合,来查看研究区域的生物学信号。
常用操作
1
下载参考基因组及注释
More
:2
数据加载
目前支持的格式包括:
拖动文件到轨迹窗口
本地文件载入
右上角点击 File
-> Load from File
,选择本地文件即可
通过 URL 加载
如谷歌的数据gs://genomics-public-data/platinum-genomes/bam/NA12877_S1.bam
,自己有服务器最好建立 ftp 站点,方便查看
通过官方服务器加载
这里有一些公共项目的数据集,有兴趣的小伙伴可以多浏览
3
搜索
在工具栏的搜索框输入,图中 C 的位置:
有几种搜索方式:
chr6:64,664,854-64,666,044
pou5f1
,但是不支持别名等其他名称搜索KRAS:G12C
,搜索 KRAS 第 12 个氨基酸上,从G 到 C 的突变。*
表示终止密码子123A>T
,搜索 KRAS 第 123 个氨基酸,从 A 到 T 的突变4
放大缩小
Shift
健,单击轨迹窗口+
Alt
健,单击轨迹窗口5
滚动平移
←
和 →
键Home
和 End
键↑
和 ↓
键Page Up
和 Page Down
键6
右键菜单
在轨迹信息栏和基因窗口都可以右键呼出如下菜单栏,我们在出图时会依次用到
绘图
1
折线图
右键选择折线图选项
修改颜色
设置颜色
设置数据值域
输入数值,也可进行 log 标准化
这里试试设置不同的数据范围,也就是值域,这里注意 Y 轴变化
Min
,Mid
,Max
依次为 0
,0
,0.2
,效果如下
Min
,Mid
,Max
依次为 -0.2
,0
,0.2
,效果如下
Min
,Mid
,Max
依次为 -1
,0
,1
,效果如下
最终效果如下:
2
散点图
切换到散点图选项
设置同折线图,效果如下
3
条形图
切换到条形图
设置同折线图,最终效果
4
热图
选择热图选项
配置参数
设置
效果
总结一下,一共可以绘制四种图,包括:
热图
折线图
条形图
散点图
5
基因
右键可以打开设置菜单,一共有三种形式选择:
堆叠形式
多个转录本堆叠在一起显示
展开形式
分别显示多条转录本
压缩形式
6
保存图片
支持格式两种 png,svg。这两种格式导出后,用 PS 和 AI 修改后就是论文中常见的图啦。
其实今天和大家一起探讨的只是冰山一角的 igv 使用技巧,如果小伙伴们有其他的使用方法,欢迎一起讨论。