专栏首页百味科研芝士多组学整合药物预测如何发6分SCI的?

多组学整合药物预测如何发6分SCI的?

今天分享的文献是2018年9月发表于EBioMedicine,标题是Integrative analysis reveals distinct subtypes with therapeutic implications in KRAS-mutant lung adenocarcinoma,影响因子为6.18;文章整合了多个组学的数据,最后落到药物预测,是比较值得借鉴的点;

名词解释

•IC50 (half maximal inhibitory concentration)最大半抑制浓度,可以用来衡量药物诱导凋亡的能力,即诱导能力越强,该数值越低;

•TIL(tumor infiltrating lymphocytes)肿瘤浸润淋巴细胞,当存在大量的肿瘤浸润淋巴细胞时,表明机体启动了对抗肿瘤的免疫反应

•SNF(Similar network fusion)相似网络融合,一种新的数据整合计算方法;首先为每种数据类型构造一个样本相似性网络,然后使用一种新的网络融合方法来对这些网络进行融合。

•cosine similarity 余弦相似性

PART

1

研究思路

• 数据来源

– 病人:Xena TCGA-LUAD 的5种数据类型(gene expression RNAseq, DNA methylation, miRNA expression, SCNAs,somatic mutation)

– 细胞系:基因表达和DNA甲基化数据(GDSC),肺癌细胞系的体细胞突变数据(COSMIC),药物敏感数据(CTRP、CCLE)

• 将病人分为两个亚型:PS1和PS2;将细胞系分为两个亚型:CS1和CS2;

• 从KRAS突变病人的多个数据类型中提取出一些有意义的生物学特征:Smoking-相关甲基化分子特征、TIL-相关得分、KRAS 依赖评分、Smoking-相关突变分子特征、STK11 和 KEAP1突变状态、其他分子特征;

• KRAS-mutant 细胞的敏感性药物筛选;

• 基于以上生物学特征,建立单因素和多因素回归模型,进行药物反应预测;

PART

2

结果

2.1划分亚型

这是后续分析的基础,整合多个组学数据后,利用SNF-CC将病人和细胞系数据划分为两个亚型;

2.2 KRAS突变相关的生物学特征

smoking-相关的甲基化分子特征

对分出的两个亚型的甲基化数据,从分子和整体水平用火山图和箱线图展示甲基化水平的变化,PS2较PS1甲基化水平高,CS2较CS1甲基化水平高;箱线图还涉及到了未突变的KRAS 的甲基化水平;

TIL相关得分

对表达数据用GSEA进行富集分析,发现:PS1和CS1的富集通路相似,PS2和CS2的富集通路相似,且与免疫相关;

对3个组别HE染色切片的TIL比例进行比较,用箱线图展示,PS2的TIL比例高于PS1且差异显著;

利用217 TIL相关基因对分出的亚型进行计算,并用箱线图展示,在病人和细胞系中,均为亚型2高于亚型1且差异显著;

KRAS 依赖得分

KRAS与Ras通路相关,为了进行评价,文章进行了KRAS依赖得分的计算;KRAS依赖得分包括Singh Score 和Loboda Score,来源于两个研究;同样,用箱线图进行整体展示;

吸烟相关突变分子图谱、STK11和KEAP1突变、其他特征

分别从病人和细胞系中提取出突变相关分子图谱,并与COSMIC的30个突变分子图谱进行比较,PSig1和CSig1与COSMIC的Sig4高度相关,因此确立了吸烟相关的分子图谱的重要性;相应在病人和细胞系亚型中进行分子图谱的比较,发现吸烟相关分子图谱在亚型1显著高于亚型2;

在病人和细胞系中展示KRAS热点突变(G12、G13、Q61等)和STK11、TP53和KEAP1突变类型的展示(STK11和KEAP1的突变在PS1显著高于PS2;在细胞系亚型中KEAP1具有相似表现);

在病人中进行相关临床特征的比较,PS1的年龄较PS2小,且具有统计学意义;

2.3 药物敏感性

基于CCLE 和 CTRPv2数据库,确立了细胞系亚型相关的药物,13种CS1特异药物,1种CS2特异药物;比较了细胞系亚型对药物的敏感性后,用箱线图进行展示;

2.4 药物预测

精准医学以来,结合多组学数据,提前对病人药物敏感性进行确认,建立这样的预测模型就变得越来越重要;

除药物敏感性数据外,以上生物学特征均在两个亚型进行了比较;这里用其来进行回归模型的构建,以单因素和多因素回归模型的方式对药物反应进行预测;单因素回归模型结果用表格展示了β的显著性;多因素结果用森林图展示β和对应显著性;

本文分享自微信公众号 - 百味科研芝士(keyanzhishi),作者:艾斯希艾

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何用TCGA数据库DNA甲基化芯片发5分文章?

    各位科研芝士的朋友好,我们今天解读一篇利用TCGA数据库中的DNA甲基化芯片分析的文章。此文18年发表在CLINICAL EPIGENETICS 杂志上,最新影...

    百味科研芝士
  • 学术名门兄弟携手发文章涉嫌学术不端,涉及多篇CNS顶刊

    财富往往代代相传,学术能力可能亦是如此,古话说“龙生龙,凤生凤,老鼠儿子会打洞”,教授家庭养出来的孩子可能也更倾向于成为教授。

    百味科研芝士
  • 23分多组学文献:胃肠腺癌的分子比较分析

    今天和大家分享一篇发表在cancer cell上的文章,影响因子23.916,这是一篇多组学分析文章。

    百味科研芝士
  • 常用功能加载宏下载

    链接: https://pan.baidu.com/s/1gy-AD39z57VjF-OcHFDlnA 提取码: w4tn

    xyj
  • 377. Combination Sum IV

    有一个不包含重复值的正整数数组nums,问从数组中选择几个数,其和为target,这样的数的组合有几种?

    眯眯眼的猫头鹰
  • 非科班渣渣的java校招

    链接:https://www.nowcoder.com/discuss/154825?type=2&order=3&pos=16&page=1

    牛客网
  • CVPR 2019 论文大盘点-人脸技术篇

    CV君今天盘点了 CVPR 2019 所有人脸相关论文,总计51篇,其中研究人脸重建与识别的论文最多,人脸识别中新Loss的设计有好几篇,人脸表情分析也不少,检...

    CV君
  • Leetcode 34 Search for a Range

    Given a sorted array of integers, find the starting and ending position of a gi...

    triplebee
  • TiDB 最佳实践系列(四)海量 Region 集群调优

    在 TiDB 的架构中,所有的数据按照 range 划分成一个个 Region 分布在多个 TiKV 实例上。随着数据的写入,一个集群中会产生上百万,甚至千万个...

    PingCAP
  • pyplot做PR-curve

    我们可以用sklearn.metrics中的precision_recall_curve()和auc()计算出PR-AUC,然后用matplotlib.pypl...

    生信编程日常

扫码关注云+社区

领取腾讯云代金券