前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用tophat-fusion鉴定融合基因

使用tophat-fusion鉴定融合基因

作者头像
生信修炼手册
发布2020-05-08 16:58:33
8600
发布2020-05-08 16:58:33
举报

欢迎关注”生信修炼手册”!

tophat-fusion 是一款利用RNA_seq 数据鉴定融合基因的工具,官网链接如下:

http://ccb.jhu.edu/software/tophat/fusion_index.shtml

该软件是集成在tophat软件中的,只需要安装好tophat之后就可以使用了,使用方法也比较简单,唯一需要注意的是目录结构。

tophat-fusion要求固定的目录结构,比如我在result文件夹下进行tophat-fusion的分析, 那么我需要在该目录下准备以下几个文件

  1. 物种对应的refGene.txt 和 ensGene.txt, 这两个文件可以从UCSC下载得到
  2. 新建一个blast 文件夹,注意文件夹的名字必须为”blast”, 在blast 文件夹下需要从NCBI下载nt, human_genomic, other_genomic开头的所有文件,下载的链接如下: ftp://ftp.ncbi.nlm.nih.gov/blast/db/
  3. 结果输出目录,每个样本对应一个输出目录,输出目录的前缀为tophat_, 下划线之后加上样本名称,类似tophat_MCF,MCF为样本的名字

当然你还需要物种对应的bowtie1的索引文件,注意这里必须为bowtie1的索引, tophat检测融合基因时推荐bowtie1的索引方式。

上述文件都准备好之后,就可以开始分析了,步骤如下

1. 比对参考基因组

第一步其实就是利用tophat将reads比对到参考基因组上,只不过对于融合基因的reads而言,其比对方式比较特殊,需要添加额外的参数,具体代码如下

tophat2 -o tophat_MCF7 -p 20 --fusion-search --keep-fasta-order --bowtie1 --no-coverage-search -r 0 --mate-std-dev 80 --max-intron-length 100000 --fusion-min-dist 100000 --fusion-anchor-length 13 --fusion-ignore-chromosomes chrM hg19_bowtie1/hg19 SRR064286_1.fastq SRR064286_2.fastq
2. 生成结果

result目录下,直接运行如下代码就可以了

tophat-fusion-post -p 20 --num-fusion-reads 1 --num-fusion-pairs 2 --num-fusion-both 5 hg19_bowtie1/hg19

默认处理的是human的融合基因,如果是其他物种,需要添加--non-human参数。

tophat-fusion会根据目录结构自动识别对应的样本, 运行完成之后,会生成一个名为tophatfusion_out的文件夹,该文件夹下是所有样本的融合基因分析结果。

我们只需要看其中的result.html文件就可以了,内容示意如下

每一列的含义如下

  1. Sample name in which a fusion is identified
  2. Gene on the “left” side of the fusion
  3. Chromosome ID on the left
  4. Coordinates on the left
  5. Gene on the “right” side
  6. Chromosome ID on the right
  7. Coordinates on the right
  8. Number of spanning reads
  9. Number of spanning mate pairs
  10. Number of spanning mate pairs where one end spans a fusion

相比fusionmap, 该软件的运行时间特别的长。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-11-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 比对参考基因组
  • 2. 生成结果
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档