在昨天的推送当中,我们介绍了现在的 CCLE 数据库的一些基本信息。同时也提到了一个用来分析 CCLE 的在线的数据库:DepMap Portal (https://depmap.org/portal/)。所以今天就来介绍一下 DepMap Portal 这个数据库具体是怎么使用的。
DepMap分析了数百个癌细胞系模型,以获取各个细胞系基因组信息以及对遗传和小分子扰动的敏感性。通过对肿瘤细胞的多重分析和研究试图来识别肿瘤的遗传和药理学依赖性以及预测它们的生物标志物。
在 DepMap 当中主要使用了三个方面的数据:CCLE, Achilles(一个肿瘤细胞系进行基因组 CRISPR 研究的组织 )以及 PRISM(一个研究基小分子物质对细胞系影响的组织)
对于 DepMap 的使用而言,主要包括两个功能:数据查看以及数据探索。不过在数据分析之前,可以选择一下自己的目标细胞系。
虽然在 DepMap 当中我们可以对所有的细胞系进行分析,但总是有一些自己的目标细胞系的。如果有的话,就可以通过 Cell Line Selector 来选择目标细胞系。在这里定义好之后,后续的分析都可以对目标细胞系进行特殊的可视化
在细胞系选择界面,如果有目标的细胞系可以直接上传自己的细胞系即可。如果没有,则点击 Creat custom list 来进行细胞系定义。默认的界面包括了细胞系名称以及细胞系所属组织。我们可以在右侧添加其他信息来进行筛选。例如我们想要筛选具有 MSI 的细胞。就可以添加一个细胞系的 MSI 特征的列。
然后通过筛选功能,就可以得到 MSI 的细胞系是哪些了。
MSI细胞系选择
在这个功能里面,通过输入想要查询的内容,就可以获得相关内容在所有数据集当中的情况。其中可以输入:细胞系;基因或者化学物质等等。例如,我们这里输入 TP53
输入完之后,就可以得到 TP53 这个基因在所有数据当中的情况。其中就包括这个基因在 全基因组 CRISPR 当中的情况,基本的分析结构,基因突变和拷贝数变化情况等等。
进一步的,可以在扰动效应( Perturbation Effects ) 查看 TP53 在基因组 CRISPR 当中的重要性。
这里由于我们之前筛选出了 MSI 的细胞系,所以可以看到具体在图形当中标注✨ 的就是 MSI 的细胞系。
而在特征(Characterization)则可以观察 TP53 在不同的细胞系当中的各个组学的情况。
TP53在各个细胞系表达情况
除了基本的查看某一个具体的基因/化学物在所有细胞系当中的特征。还可以直接直接分析两个特征之间的关系。
数据探索入口
数据探索主要是通过散点图的方式进行呈现的。我们只需要定义 X 轴和 Y 轴之间具体的是什么内容即可。 这里我们尝试分析 TP53 甲基化和 TP53 表达的关系。
通过输入,就可以看到TP53 表达和甲基化在散点图上的具体位置。同时也可以看到 Pearson以及Spearman 相关分析的相关系数。
TP53 甲基化和 TP53 表达的关系
通过分析发现这俩没有多大关系。
以上是对所有的细胞系进行的分析。我们也可以在 View Options 中进行亚组分析。例如,我们选择种属(Lineage)。在选择之后,就可以看到两者在不同种属当中的相关系数。查看数据可以发现在子宫当中TP53的甲基化和 TP53的表达存在负相关。
TP53 甲基化和 TP53 表达的在子宫当中关系
图中标注✨ 的也是之前筛选的 MSI 的细胞系。
以上就是 DepMap 数据库的基本使用方法了。通过 DepMap 我们不止来分析 CCLE 的数据也可以分析其他和肿瘤细胞系有关的一些数据。有需要的可以去检索一下哈。