一、基本介绍
JBrowse (http://gmod.org/wiki/JBrowse)是和GBrowse具有同样功能的基因组浏览器,只是它是基于HTML5 JavaScript等前端技术通过AJAX界面来实现的,这样大部分的工作都能通过用户的浏览器来完成,就可以降低对服务器的性能要求,从而实现快速访问浏览基因组数据。具有如下特点:
--支持快速、平滑的滚动和缩放,能较快的浏览你的基因组数据
--支持Gb级别乃至Tb级别数据量,数据存储和呈现压力由后端服务器承载
--支持大多数基因组学常用格式(如GFF3、BED、FASTA、Wiggle、BigWig、BAM、VCF等其它格式)
--强大的后续支持,定期更新和维护(官网:http://jbrowse.org/),活跃的讨论社群(https://github.com/GMOD/jbrowse/issues),详细的使用文档(http://gmod.org/wiki/JBrowse_Configuration_Guide)
这些特点注定了JBrowse的不平凡,无论是JBrowse的前任GBrowse,还是NCBI的MapViewer和UCSC Genome Browser,从使用体验和技术维护等级角度已经都远远落后于上进的JBrowse,Youtubes的视频Evolution of jbrowse (Gource Visualization)(https://www.youtube.com/watch?v=FX6lTdTtcAI)表现了Jbrowse从2007年(图1)-2015年(图2)的发展历程和人员结构变化。
图1
图2
二、下载安装
下载地址:https://github.com/GMOD/jbrowse/releases 选取想要的版本
快速使用指南:http://jbrowse.org/code/JBrowse-1.13.1/docs/tutorial/,一般而言选最新版1.13.1:https://github.com/GMOD/jbrowse/releases/download/1.13.1-release/JBrowse-1.13.1.zip
注意:这边JBrowse的安装地址很重要,没有找对地址,是无法将JBrowse展现出来的
一般linux服务器的根目录为 /var/www ,安装了xampp的,根目录是会在/opt/lampp/htdocs下,当然这个根目录是可以在http.conf配置文件中进行修改
我这边安装了xampp,根目录就在/opt/lampp/htdocs,直接就在根目录下安装运行JBrowse
进入到 示例网站是这样的效果(图3),这边网址和上面的有些不同,是IP地址https://JBrowse-1.13.1/index.html?data=sample_data/json/volvox。IP地址就是你安装JBrowse的linux服务器的IP地址,可以用ifconfig查看, 一般第一个i网卡etho的地址,inet addr:这个后面跟的就是你需要的IP地址
图3
三、基本用法
在实际操作之前,还有几点注意事项,
--因为JBrowse可以同时建立多个物种的基因组浏览器,也是避免出错和方便,所以每个物种建立基因组浏览器之前都需要先建立单独的文件夹
--由于linux本地磁盘一般存储有限,一般只有几十G,而基因组数据量动辄上百G,所以数据我们一般放在存储磁盘中,通过软连接形式建立连接到特定数据文件夹
--初学者在更改基因组配置文件时,千万记得备份,特别是数据数量比较多的时候,以此避免出现麻烦
--通过bin/目录下命令导入轨迹时,--out是指定输出物种基因浏览器文件夹的,是必不可少的,同时参数内部不能出现空格
--每个物种的基因组浏览器的访问网址为:http://IP_address/JBrowse-1.13.1/index.html?data=DIR, DIR是物种文件夹
以下导入的数据类型,均可以在https://JBrowse-1.13.1/index.html?data=sample_data/json/volvox下看到具体效果
1、导入参考基因组
2、导入注释文件
3、导入BAM文件
BAM为了批量操作,通常在tracks.conf配置文件中写入。
实例:
4、VCF文件导入
同样也是直接在tracks.conf配置文件中写入。 但是VCF文件先需要做预处理
5、导入定量数据文件BW
定量文件即bw文件如何生成呢,需要一定软件的转换,如何进行转换以及更多高级JBrose 用法将会在下回进行讲解。
领取专属 10元无门槛券
私享最新 技术干货