我测试了一下Jbrowse的安装及初步试用

前些天我们公众号元老,熊,投稿了关于Jbrowse的史上最全介绍,如下:

可能是最全的JBrowse基因浏览器介绍(请点击阅读)

最为生物信息学痴的我当然不能错过,今天终于找到了空隙时间来体验一把!

全部体验报告如下:

起初我是在windows安装这个的,因为是浏览器而已嘛

下载jbrowse最新版解压,然后setup,但是log日志显示全部失败了,如下:

http://gmod.org/wiki/JBrowse_FAQ 我简单浏览了一下FAQ;

似乎我想的简单了,还是去我的linux里面安装吧~

用的是下面的方法来安装jbrowse:

如果失败了,是下面这样:

如果成功了是下面这样:

其实上面两个截然不同的结果只是因为我用的是不同的服务器,前者是腾讯云,ubuntu14,后者是亚马逊云,ubuntu16,作为生物出身的生信工程师,我其实很烦这种计算机配置错误,没有学过原理,只能凭直觉和谷歌一步步解决,最后也只是解决了问题而已。

我简单搜索了一下两者的setup.log文件,发现腾讯云的ubuntu14之所以会failed,是因为好几个perl模块没有自动安装成功。

XML::DOM

XML::Parser

Bio::FeatureIO

List::MoreUtils

我只好用cpan手动安装了这几个模块:http://www.biotrainee.com/thread-1257-1-1.html

当然,这些模块不安装也不影响简单试用。

理论上成功之后,两个测试数据是可以直接访问了的,如下:

http://your.jbrowse.root/index.html?data=sample_data/json/volvox

http://your.jbrowse.root/index.html?data=sample_data/json/yeast

我是在我们论坛上面安装的,所以应该是:

http://biotrainee.com/jbrowse/JBrowse-1.12.1/index.html?data=sample_data/json/volvox

http://biotrainee.com/jbrowse/JBrowse-1.12.1/index.html?data=sample_data/json/yeast

只访问测试数据当然不算成功啦,我们要学会自己做数据,这里我选择bowtie2自动的参考基因组和测序数据来用Jbrowse格式化好数据以供访问。

wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip

unzip bowtie2-2.2.9-linux-x86_64.zip

有了这些测试数据,我们就可以先看看示例数据是什么,然后把我们的测试数据做出那个样子:

可以看到里面有3个文件夹,其中seq是存放json格式化的参考基因组的。

mkdir bowtie2_data

第一步,准备参考基因组

bin/prepare-refseqs.pl --fasta bowtie2-2.2.9/example/reference/lambda_virus.fa --out bowtie2_data/

这个时候已经可以浏览配置好的基因组了

http://biotrainee.com/jbrowse/JBrowse-1.12.1/index.html?data=bowtie2_data

第二步,准备特征序列

貌似这个测试数据没有,因为这个是病毒基因组,如果有的话用下面 命令即可。

bin/flatfile-to-json.pl --[gff|gbk|bed] <flat file> --tracklabel <track name> [options]

只有两个必要的参数, --gff/bed用来指定数据格式,而 --tracklabel 用来给track设定ID(track 的身份证号),非必需的 --key参数可以理解为track 的名字

第三步,准备展示数据

这里是sort好的bam文件的比对结果。

./bowtie2-2.2.9/bowtie2 -x ./bowtie2-2.2.9/example/index/lambda_virus -U ./bowtie2-2.2.9/example/reads/longreads.fq | samtools sort -O bam -o test.bam

samtools index test.bam

要运行上面代码必须保证samtools 版本是最新的,比如Version: 1.3.1

然后就修改 tracks.conf文件即可,文件内容如下:

[tracks.alignments]

urlTemplate=../test.bam

type=Alignments2

以上3个步骤并不是都一定要做,只有参考基因组也可以的。参考基因组+bam文件也可以。

结果展示如下:

http://biotrainee.com/jbrowse/JBrowse-1.12.1/index.html?data=bowtie2_data

这个网页粗看起来就这样了,但是细节很坑的,需要花费时间还是挺长的,如果想真正做到定制化。

http://gmod.org/wiki/JBrowse_Configuration_Guide

点击原文链接去我们论坛看看吧~

原文发布于微信公众号 - 生信技能树(biotrainee)

原文发表时间:2017-03-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT大咖说

容器化RDS|计算存储分离架构下的 IO 优化

摘要 在基于 Kubernetes 和 Docker 构建的私有 RDS 中,普遍采用了计算存储分离架构。该架构优势明显, 但对于数据库类 Latency Se...

3198
来自专栏ATYUN订阅号

你一定要知道!数据科学家提高工作效率的基本工具

当开始从事数据科学相关行业的时候,很多人都会被各种各样的可用工具所困扰。 有一些与这个问题相关的可用指南。例如“对于不擅长编程者的19日数据科学工具(链接地址为...

2944
来自专栏斑斓

Spark发布1.3.0版本

3月13日,Spark 1.3.0版本与我们如约而至。这是Spark 1.X发布计划中的第四次发布,距离1.2版本发布约三个月时间。据Spark官方网站报道,此...

3186
来自专栏沃趣科技

容器化RDS|计算存储分离架构下的 IO 优化

在基于 Kubernetes 和 Docker 构建的私有 RDS 中,普遍采用了计算存储分离架构。该架构优势明显, 但对于数据库类 Latency Sensi...

2834
来自专栏python开发者

Ubuntu Desktop安装及桌面美化(修复图片)

Ubuntu Desktop安装及桌面美化 1   开篇概述 本 系统的文章主要是讲互联网方向的开发主题。根据目前主流互联网公司的技术架构,Linux是必不可少...

3105
来自专栏沃趣科技

容器化RDS|计算存储分离架构下的IO优化

在基于 Kubernetes 和 Docker 构建的私有 RDS 中, 普遍采用了计算存储分离架构. 该架构优势明显, 但对于数据库类 Latency Sen...

4376
来自专栏一个会写诗的程序员的博客

《MongoDB极简教程》第一章 NoSQL简史 & MongoDB安装&环境配置NoSQLNoSQL 简史CAP定理(CAP theorem)BASEMongoDB 特性&优势文档参考安装&环境配置

MongoDB 是一款开源的文档数据库,并且是业内领先的 NoSQL 数据库,用 C++ 编写而成。

653
来自专栏腾讯大数据的专栏

Hadoop Raid-实战经验总结

分布式文件系统用于解决海量数据存储的问题,腾讯大数据采用HDFS(Hadoop分布式文件系统)作为数据存储的基础设施,并在其上构建如Hive、HBase、Spa...

18610
来自专栏北京马哥教育

给新手的最佳类Windows界面的Linux发行版

糖豆贴心提醒,本文阅读时间5分钟 halo艾瑞巴蒂~最近有新童鞋向小编诉苦,刚刚从熟悉的Windows系统来到陌生的Linux世界里,看到辣么多基于Linux...

2995
来自专栏杨建荣的学习笔记

多套Oracle 10g整合迁移到11g的方案

在数据迁移中,除了跨平台,全量,增量数据迁移之外,还有一类会把已有的难度升级,那就是整合式迁移,比如原来有两个数据,迁移后是一个,类似这样的需求,如果再加...

3113

扫码关注云+社区