前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >保姆级 IGV 基因组浏览器使用指南(图文详解)

保姆级 IGV 基因组浏览器使用指南(图文详解)

作者头像
王诗翔呀
发布2021-09-03 11:48:15
2.5K0
发布2021-09-03 11:48:15
举报
文章被收录于专栏:优雅R

话说上次更新完在线基因组浏览器的推文,小伙伴们都很感兴趣。

一步一步教你用基因组浏览器(图文)

这次我们一起科研论文中常用到的桌面级基因组浏览器 IGV,优势在于可以离线使用,方便大家直接查看本地文件,而且渲染速度相较在线基因组浏览器网站要快不少。

这篇推文同样以实战的形式教大家快速上手。

软件下载

IGV 官网下载:

http://software.broadinstitute.org/software/igv/download

这里以下载预装 Java 的 Windows 版本 IGV 为例。

由于大部分数据是通过服务器跑出的结果,所以也有小伙伴有在 Linux 服务器端使用的需求。这里推荐几种方式:

  • 配合远程控制软件来使用,国产推荐 Todesk,向日葵
  • 目前有部分单位禁止使用远程软件,推荐结合 Jupyter 来使用
  • 建立 FTP 来通过 url 访问

建议最好安装在固态硬盘所在分区,提高加载速度。

如果没有在桌面找到 IGV 软件,按住 Win 键,搜索 igv 可以找到并运行

IGV 有下载文件的需求,所以要通过网络访问权限

二、软件介绍

1

数据载入

为了方便介绍功能,我们需要先下载几个测试数据:

测试数据来自人肝脏的 DNaseq 数据,分别为bigbed 文件与 bigwig 文件:

bigbed 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF812QNX%5Fpeaks%5Fmm10%2EbigBed

bigwig 文件:https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE172690&format=file&file=GSE172690%5FENCFF705ESF%5Fread%2Ddepth%5Fnormalized%5Fsignal%5Fmm10%2EbigWig

想了解更多基因组相关文件格式:https://blog.csdn.net/u011262253/article/details/109367884

载入数据:

成功载入数据

切换到其中一个染色体:

2

软件面板

这里分五大部分来介绍:

  • 工具栏
  • 轨迹信息栏
  • 基因组窗口
  • 轨迹窗口
  • 基因窗口

工具栏

从左到右依次为划分为三个小工具:

参考基因组工具

a. 选择参考基因组物种及版本,如果没有本地版本,需要联网下载

b. 选择染色体编号

c. 搜索染色体区间,格式如图所示,最常用的功能还是输入感兴趣的基因,直接跳转到对应的位置

视图操作工具

依次为主页面,前一步,后一步,刷新,定义区域,Trace适屏,弹出信息显示

缩放工具

用于控制整个视图的缩放比例,快捷键

轨迹信息栏

右键可以打开菜单,进一步修改,后面详细来研究。

基因组窗口

上部分为整条染色体,点击即可跳转该位置

下半部分为目前染色体可见部分对于的染色体位置,用刻度线标识,单位为碱基数。

轨迹窗口

每一行代表一个样本的 Trace,右键可以打开菜单,进一步修改,后面详细来研究。

基因窗口

显示基因的特征区域,可以与 Trace 面板配合,来查看研究区域的生物学信号。

常用操作

1

下载参考基因组及注释

  • 左上角点击 More:
  • 搜索物种名及其参考基因组版本: 更多参考基因组知识:https://blog.csdn.net/u011262253/article/details/117486244
  • 进入下载进度,这一步比较慢,建议科学上网或晚上挂着下载

2

数据加载

目前支持的格式包括:

  • 序列比对:bam,cram
  • 基因组注释:bed, gtf, gff3, psl, bigbed
  • 信号数据:wig, bedgraph, bigwig, tdf
  • 拷贝数:seg

拖动文件到轨迹窗口

本地文件载入

右上角点击 File -> Load from File,选择本地文件即可

通过 URL 加载

如谷歌的数据gs://genomics-public-data/platinum-genomes/bam/NA12877_S1.bam,自己有服务器最好建立 ftp 站点,方便查看

通过官方服务器加载

这里有一些公共项目的数据集,有兴趣的小伙伴可以多浏览

3

搜索

在工具栏的搜索框输入,图中 C 的位置:

有几种搜索方式:

  • 按基因组坐标搜索:chr6:64,664,854-64,666,044
  • 按基因名搜索:如 pou5f1,但是不支持别名等其他名称搜索
  • 按突变搜索,支持两种格式:
    • KRAS:G12C,搜索 KRAS 第 12 个氨基酸上,从G 到 C 的突变。* 表示终止密码子
    • 123A>T,搜索 KRAS 第 123 个氨基酸,从 A 到 T 的突变

4

放大缩小

  • 放大:
    • 双击轨迹窗口
    • 按住 Shift 健,单击轨迹窗口
    • 点击缩放工具 +
    • 在基因组标尺窗口按住左键滑动,选中区域便会放大
  • 缩小:按住 Alt 健,单击轨迹窗口

5

滚动平移

  • 水平移动
    • 按住左键在轨迹窗口左右拖动
    • 点击基因组标尺或染色体图
    • HomeEnd
  • 垂直滚动
    • 按住左键在轨迹窗口上下拖动
    • Page UpPage Down

6

右键菜单

在轨迹信息栏和基因窗口都可以右键呼出如下菜单栏,我们在出图时会依次用到

绘图

1

折线图

右键选择折线图选项

修改颜色

设置颜色

设置数据值域

输入数值,也可进行 log 标准化

这里试试设置不同的数据范围,也就是值域,这里注意 Y 轴变化

  • 设置Min,Mid,Max 依次为 0,0,0.2,效果如下
  • 设置Min,Mid,Max 依次为 -0.2,0,0.2,效果如下
  • 设置Min,Mid,Max 依次为 -1,0,1,效果如下

最终效果如下:

2

散点图

切换到散点图选项

设置同折线图,效果如下

3

条形图

切换到条形图

设置同折线图,最终效果

4

热图

选择热图选项

配置参数

设置

效果

总结一下,一共可以绘制四种图,包括:

热图

折线图

条形图

散点图

5

基因

右键可以打开设置菜单,一共有三种形式选择:

堆叠形式

多个转录本堆叠在一起显示

展开形式

分别显示多条转录本

压缩形式

6

保存图片

支持格式两种 png,svg。这两种格式导出后,用 PS 和 AI 修改后就是论文中常见的图啦。

其实今天和大家一起探讨的只是冰山一角的 igv 使用技巧,如果小伙伴们有其他的使用方法,欢迎一起讨论。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 优雅R 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 二、软件介绍
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档