专栏首页生信技能树学徒作业-在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵

学徒作业-在CCLE数据库里面根据指定基因在指定细胞系里面提取表达矩阵

看到发表在 Cell. 2020 Mar 4. 的文章的研究项目里面有 4个10X样本,题目是:Complement Signals Determine Opposite Effects of B Cells in Chemotherapy-Induced Immunity. (PMID:32142650,DOI:10.1016/j.cell.2020.02.015) ,我没有细看文章的生物学故事,不过注意到附件有一个图表很有趣:

指定基因在指定细胞系的表达量热图

适合作为学徒作业,你需要去搜索了解一下CCLE数据库,下载它的RNA-seq表达矩阵,然后根据图里面的基因名字和细胞系名字,取出需要的表达矩阵,然后热图可视化即可。

详细的图例是:The relative expression of complement regulatory proteins (CD55, CD46, CRIg, CR1, Factor H, Factor I, FHL1, C4BP, Properdin and C1INH) in BT474, BT549, MDA-MB-231, HCC1937, MDA-MB-361, MDA-MB-436, MDA-MB-468, AU565, SK-BR-3, MCF-7 and MDA-MB-453 cells were evaluated by using mRNA data from the Barretina Cell Line database.

CCEL数据库介绍

需要简单注册后才能下载:https://portals.broadinstitute.org/ccle/users/sign_in

下载到需要的数据文件后可以先看看CCLE里面收集的细胞系表型信息,大家可以自由统计。

options(stringsAsFactors = F)
a=read.table('data/CCLE_sample_info_file_2012-10-18.txt',sep = '\t',header = T)
as.data.frame(sort(table(a$Source),decreasing = T))
##                       Var1 Freq
## 1                     ATCC  437
## 2                     DSMZ  221
## 3                    HSRRB  121
## 4                     KCLB   66
## 5                    RIKEN   66
## 6                    ECACC   62
## 7  Academic Lab / Achilles   42
## 8             Academic Lab   12
## 9                     ICLC    7
## 10                NCI/DCTD    7
## 11                            5

其它细胞系药物作用数据库

提到细胞系药物作用数据库,最出名的是 Cancer Cell Line Encyclopedia (CCLE) 和 Cancer Genome Project (CGP) / Genomics of Drug Sensitivity in Cancer (GDSC) 这两个:

  • CCLE (www.broadinstitute.org/ccle/)
  • GDSC/CGP (www.cancerrxgene.org/)

其实还有broad的 CTRP和Roche的geneTech公司的数据库也类似。

其中 GDSC 也就是 CGP,包含着4种数据。

本文分享自微信公众号 - 生信技能树(biotrainee),作者:生信技能树

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-03-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【直播】我的基因组50:从测序深度和位点间距来看SNV分布情况

    今天的我们,还是继续探究那一个困扰我这么久的问题。为什么我作为堂堂正正的男性,明明X,Y染色体都只有一条,可是却测到了那么多的杂合突变的问题。 在之前,我们在Q...

    生信技能树
  • 如果你想分析的表达矩阵的芯片全世界只有15个发表的研究

    而且部分芯片,使用的人就非常少,你想学习前人的数据分析策略, 都很难,你应该是会很奔溃吧,比如我们之前介绍过的 [HuGene-2_0-st] Affymetr...

    生信技能树
  • 全球首个“个人参考基因组服务计划(PRGSP)”正式启动

    北京时间2018年3月31日晚间,北京希望组生物科技有限公司(以下简称“希望组”)在南京举行的第五届NGS创新开发者大会,与北京基云惠康科技有限公司(以下简称...

    生信技能树
  • Sass-学习笔记【进阶篇】

    xing.org1^
  • Sass-学习笔记【进阶篇】

    没有sass基础请移步:【Sass-学习笔记【基础篇】】http://www.cnblogs.com/padding1015/articles/7056323....

    xing.org1^
  • Sass控制命令及函数知识整理

    xing.org1^
  • 汇编基础

    ​ cup与所有内存之间:地址总线,数据总线,控制总线,每条线对应不同信息,指令与数据分开

    Dean0731
  • 机器学习(一)

    最近在Coursera 上学习斯坦福大学的机器学习。根据费曼学习法的理论,教是最好最快最有效果的学习方法。因此,我将会开一系列机器学习相关的文章,同步我的学习进...

    青南
  • Vue教程(动画-半场动画)

      上篇文章我们介绍了过渡动画的实现,包括完整的 入场 和 离场 动画,但是在实际过程中我们有时可能仅仅需要使用半场动画,比如淘宝购物车的下单处理等。

    用户4919348
  • Q4OS 3.8 LTS 发布,基于 Debian Buster

    Q4OS 3.8 稳定版发布了(发布公告),代号为“Centaurus”。这是一个长期支持(LTS)版本,支持至少五年的安全补丁和软件更新。

    Debian社区

扫码关注云+社区

领取腾讯云代金券