前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Oncomine:肿瘤芯片数据库

Oncomine:肿瘤芯片数据库

作者头像
生信修炼手册
发布2019-12-20 11:15:30
1.4K0
发布2019-12-20 11:15:30
举报
文章被收录于专栏:生信修炼手册生信修炼手册

肿瘤作为人类健康的头号杀手,其研究的重要性不言而喻。随着芯片和NGS技术的发展,发表了很多的肿瘤相关数据。然而这些数据来自不同的组织和团队,由于缺乏统一的数据管理和组织,这些数据在发表之后就没有再利用了,为了提高数据利用率,促进肿瘤研究的发展,Oncomine的开发团队收集了各种来源的肿瘤相关的芯片数据,用标准化的分析流程处理这些数据,数据分析的结果通过web服务查询和可视化,对应的文章链接如下

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1635162/

数据库的网址如下

https://www.oncomine.org/resource/main.html

该网站只对科研工作者免费开放,需要学术邮箱注册对应的账号。该数据库中主要收录了以下两种类型的肿瘤芯片数据

  1. mRNA expression
  2. DNA copy number

每批芯片数据用dataset表示,所有芯片数据对应的肿瘤类型和样本数示意如下

对于芯片数据,主要进行了以下几种类型的分析

  1. coexpression analyses
  2. differential expression analyses
  3. outlier analyses

首页的面板分成了3个部分,示意如下

最左侧的部分用于对数据进行检索或者筛选,中间的面板用于展示所有的数据集,最右侧的面板用于显示数据集的详细结果。最基本的展现形式是热图,示意如下

1. 共表达分析

在search框中指定一个感兴趣的基因,然后可以查看在特定数据集中与该基因存在共表达的基因结果,示意如下

correlation从0到1,越接近于0, 说明相关性越高。

2. 差异分析

有以下两种差异分析

  1. cancer_vs_cancer
  2. cancer_vs_normal

差异分析的热图示意如下

给出了差异的pvalue, fold change等统计学指标,对于多个基因的差异分析,用上述的热图形式展现,对于单个基因的差异分析结果,展现形式如下

用柱状图的形式展示基因在每个样本中的表达量,每个柱子代表一个样本。

3. outlier 分析

由于肿瘤样本的异质性,会出现原癌基因只在部分样本中过表达的例子,当用所有样本进行差异分析时,这部分基因的差异分析结果并不显著,为此专门开发了一种离群值分析的算法,全称如下

cancer outlier profile analysis

简称COPA, 来识别只在部分肿瘤样本中高表达的潜在的原癌基因。结果示意如下

COPA值越高,说明该基因越可能是一个真实的离群基因。通过Oncomine数据库,可以方便的探究肿瘤相关的DNA拷贝数和基因表达谱数据。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 共表达分析
  • 2. 差异分析
  • 3. outlier 分析
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档