前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >mutagene:肿瘤突变频谱数据库

mutagene:肿瘤突变频谱数据库

作者头像
生信修炼手册
发布2019-12-19 15:50:26
7830
发布2019-12-19 15:50:26
举报
文章被收录于专栏:生信修炼手册生信修炼手册

mutagene是一个肿瘤突变频谱数据库,从ICGA, TCGA等肿瘤项目中收集整理蛋白编码基因上的体细胞突变数据,分析识别对应的突变频谱,对应的文章发表在Nucleic Acids Research,链接如下

https://academic.oup.com/nar/article/45/W1/W514/3796332

网址如下

https://www.ncbi.nlm.nih.gov/research/mutagene/ 通过Explore菜单,可以查看数据库中收录的突变频谱信息,包括两个部分

1. Mutational profiles

根据以下4种条件,分别计算突变频谱

  1. Cancer types
  2. Primary tumor sites
  3. Benign samples
  4. Cancer Census Genes

以肿瘤类型为例,结果示意如下

每个突变频谱用一个MG开头的编号唯一标识,提供了对应的频率分布柱状图,示意如下

2. Mutational signatures

采用NMF非负矩阵分解算法,从突变频谱中提取突变特征,提供了以下几种特变特征

  1. MUTAGENE-5 signatures
  2. MUTAGENE-10 signaltures
  3. COSMIC-30 signatures

结果如下所示

通过Compare可以比较不同的突变频谱,根据样本的突变频谱进行聚类,结果示意如下

多个突变频谱的比较,结果用热图来呈现,定义了以下4种距离来衡量不同突变频谱之间的差异

  1. Chi-squared distance
  2. Cosine distance
  3. Helliger distance
  4. Jensne-Shannon distance

详细的计算公式可以参考官方文档,多个频谱比较的热图示意如下

个突变频谱的比较,结果包含以下4个部分

1. Scatterplot

用散点图的形式展示突变频率在两种频谱频谱中的分布,结果示意如下

2. Log-ratio plot

计算两种频谱中的频率比值的对数,大于0代表在一组中高表达,小于0代表在另一组中高表达,用柱状图的形式展示log ratio的值,结果示意如下

3. Histograms

将两种频谱的柱状图放在一起,便于比较,结果示意如下

4. Distance measures

结果示意如下

除此之外,官网还支持上传VCF文件,计算突变频谱等功能,更多用法请参考官网的帮助文档。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. Mutational profiles
  • 2. Mutational signatures
  • 1. Scatterplot
  • 2. Log-ratio plot
  • 3. Histograms
  • 4. Distance measures
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档