前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用fusioncatcher进行融合基因的分析

使用fusioncatcher进行融合基因的分析

作者头像
生信修炼手册
发布2020-05-08 17:00:44
1.2K0
发布2020-05-08 17:00:44
举报
文章被收录于专栏:生信修炼手册生信修炼手册

欢迎关注”生信修炼手册”!

在某篇评估转录组各个分析流程所用软件的文章中,fusioncatcher 被评为分析融合基因的最佳工具,该软件的网址如下

https://github.com/ndaniel/fusioncatcher

这个软件的安装过程比较繁琐,依赖很多第三方软件,为了简化安装,官方提供了自动化的安装脚本, 用法如下

代码语言:javascript
复制
wget http://sf.net/projects/fusioncatcher/files/bootstrap.py -O bootstrap.py
python bootstrap.py -t --download

该脚本会自动下载依赖的软件包并安装。软件的使用相对简单很多,分为以下两步

1. 准备参考基因组

fusioncatcher也提供了准备参考基因组的脚本,该脚本会从Ensembl等网站自动下载数据,所以使用时需要联网,用法如下

代码语言:javascript
复制
fusioncatcher-build -g mus_musculus -o /db/mouse -w asia.ensembl.org

-g参数指定参考基因组的物种名称,-o指定输出结果的目录,-w参数指定ensembl web service, 即biomart的的网址。需要注意的是,-w参数一定要设置成上述示例中的样子,默认参数是不可以的,另外对于人和小鼠而言,因为会从gencode数据库下载文件,而gencode的FTP地址发生了变动,所以要手动修改源代码中gencode的FTP地址。

对于-o参数的取值,可以参考如下链接

ftp://ftp.ensembl.org/pub/current_fasta

该目录下每个物种对应一个文件夹,fusioncatcher就是根据-o参数的取值来下载对应物种的序列。

除了下载文件,该步骤还包括建立索引等费时较长的步骤,所以这一步的运行时间会比较久,需要5-10个小时。

对于human而言,官方提供基于Ensembl release 90版本建立的数据库,下载方式如下

代码语言:javascript
复制
mkdir -p /some/human/data/
cd /some/human/data/
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.aa
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ab
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ac
wget http://sourceforge.net/projects/fusioncatcher/files/data/human_v90.tar.gz.ad
cat human_v90.tar.gz.* | tar xz
ln -s human_v90 current
2. 运行

用法如下

代码语言:javascript
复制
fusioncatcher \
-d  database_directory  \
-i   fastq_directory  \
-o  output_directory

-d参数指定物种的参考基因组所在目录,-i参数指定样本对应的原始测序数据fastq文件所在目录,-o参数指定输出结果的目录。

对于原始序列所在的目录,在该目录下可以同时存在多个样本的结果,软件会自动识别不同样本对应的R1和R2端数据。

由于fusioncatcher内置了质量控制的程序,会自动对fastq文件进行去除adapter,去除低质量等分析,所以我们只需要提供原始的测序数据就可以了。

在输出目录中,final-list_candidate-fusion-genes.txt 就是最终预测到的所有融合基因,这个目录下文件很多,每个文件的详细解释可以参考官方文档。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 准备参考基因组
  • 2. 运行
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档