前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >oncotator:肿瘤研究专用的突变注释软件

oncotator:肿瘤研究专用的突变注释软件

作者头像
生信修炼手册
发布2019-12-19 10:49:09
1.4K0
发布2019-12-19 10:49:09
举报
文章被收录于专栏:生信修炼手册

目前,较为流行的突变注释软件有以下3种

  1. ANNOVAR
  2. SnpEff
  3. Variant Effect Predictor(VEP)

这三款软件适用范围广,可以注释任何的基因组变异,无论是germline还是somatic variants。通用性强的同时,带来的问题就是针对肿瘤基因组研究而言,其注释结果中缺乏肿瘤特异性的注释内容,而且其注释结果为VCF格式,需要进一步转换为MAF格式才可以进行肿瘤研究的下游分析,不够便利。

为了解决这个问题,Broad Institute的科学家开发了一款名为oncotator的注释软件,专门针对肿瘤基因组研究进行设计,其注释结果可以直接输出成MAF格式,官网如下

https://software.broadinstitute.org/cancer/cga/oncotator

该软件集成了14种不同来源的注释信息,分成以下4大类别

  1. Genomic Annotations
  2. Protein Annotations
  3. Cancer Variant Annotations
  4. Non-Cancer Variant Annotations

不同类别对应的数据库展示如下

该软件的源代码保存在github上,网址如下

https://github.com/broadinstitute/oncotator/releases

同时该软件依赖一个整合好的数据库,下载方式如下

代码语言:javascript
复制
wget -r  "ftp://gsapubftp-anonymous@ftp.broadinstitute.org/bundle/oncotator/"

数据库大小为17G, 软件采用python进行开发,其安装过程比较简单,基本用法如下

代码语言:javascript
复制
oncotator \
-v  \
--db-dir /oncotator_v1_ds_Jan262015 \
--input_format=VCF \
--output_format=TCGAMAF \
input.vcf \
output.maf \
hg19

db-dir参数指定下载的数据数据库的路径,最后三个参数对应输入文件,输出文件和基因组版本,该软件只支持hg19版本。

为了方便没有编程经验的科研工作者,同时也提供了web 服务,网址如下

http://portals.broadinstitute.org/oncotator/

上传tsv格式的突变数据即可,示意如下

结果展示如下

通过该软件可以得到MAF格式的注释文件,更加方便的用于下游的数据分析。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档