Cancer Therapeutics Response Portal (CTRP)
肿瘤药物敏感性基因组学数据库(Genomics of Drug Sensitibity in Cancer,GDSC)由英国桑格研究院开发,收集肿瘤细胞对药物的敏感度和反应数据。癌基因组的变异会影响临床治疗的效果,不同的靶点对药物的反应也有很大不同。因此这类数据对于发现潜在的肿瘤治疗靶点十分重要。
那么,比较权威的资源一般就是Cancer Therapeutics Response Portal (CTRP) 和 Genomics of Drug Sensitivity in Cancer (GDSC)
在第一期的GDSC数据总览中,我们根据数据库的模块进行总体的介绍。今天我们再深入了解GDSC所包含的数据及其获取的方法,也就是GDSC的数据下载模块。
现在我们可以尝试一下使用R包之oncoPredict对你的表达量矩阵进行药物反应预测啦!
--生信自学网
适合作为学徒作业,你需要去搜索了解一下CCLE数据库,下载它的RNA-seq表达矩阵,然后根据图里面的基因名字和细胞系名字,取出需要的表达矩阵,然后热图可视化即可。
预测癌症患者对癌症药物的反应是精准医疗的重要问题。由于花大量的时间与金钱完成大批量癌症患者与药物之间反应的实验验证是不切实际的,业界非常期待一种基于癌细胞株的大规模药物基因组学临床前预测模型的出现,然而,大多数现有研究主要基于癌细胞的基因组相似性,忽略了基因之间的关系,导致不能很好的预测细胞株的药物反应。
现在可以尝试一下理解药物预测的原理啦,首先我们看看仅仅是相关性,能不能搞定药物预测!
oncoPredict 是一款用来预测药物反应的R包,背景知识有很多介绍的了,这里介绍下真实的使用场景 以及 后续联合基因表达,分子分型 或者 预后模型等的联合。
实验室主要开发的数据库和工具,实验室链接(http://bioinfo.life.hust.edu.cn/guo_lab#!/,感兴趣的小伙伴可以去看看!
本文介绍来自得克萨斯大学(UT)休斯顿健康科学中心和MD安德森癌症中心的研究者在Nature发表的论文《Deep generative neural network for accurate drug response imputation》,其推出了一种可将数千个基因压缩成低维空间隐向量的深度变分自编码(VAE)模型,其研究成果使得在更精细的尺度上探索肿瘤样本的药物反应成为可能。
本文介绍由印度的德里印度理工学院Debarka Sengupta研究员团队和澳大利亚昆士兰州的前列腺癌研究中心的Colleen C. Nelson教授团队联合发表在Nature Communications的研究成果。肿瘤间和肿瘤内异质性是癌症治疗的主要障碍,会导致癌症患者出现不同的药物反应。高通量筛选数据集为基于机器学习的个性化治疗建议铺平了道路。本文作者介绍了Precily,这是一种使用基因表达数据推断癌症治疗反应的预测建模方法。作者展示了将通路活性估计与药物描述符结合作为特征的好处。作者将Precily应用于与数百个癌细胞系相关的单细胞和bulk RNA测序数据。然后,作者使用他们内部的前列腺癌细胞系和暴露于不同治疗条件的异种移植数据集来评估治疗结果的可预测性。此外,作者证明了本文方法对来自癌症基因组图谱的患者药物反应数据的适用性,以及描述三名黑色素瘤患者治疗过程的独立临床研究。研究结果强调了化学转录组学方法在癌症治疗选择中的重要性。
药物敏感性分析是生信数据挖掘常用的技能之一,目前做药敏分析最常见的就是两个R包:pRRophetic和oncoPredict。
本次报道的论文是来自赫尔辛基大学医学院的Jing Tang老师团队发表在nature communications上Bipartite network models to design combination therapies in acute myeloid leukaemia。文章提出了一个通过对患者相关药物反应数据的二分图网络建模来识别潜在的药物组合。在此项研究中选择性药物组合的药效和协同作用水平在体外治疗急性骨髓性白血病的三个细胞系中证实了与单药治疗的区别。本文中介绍了一种名义上的数据挖掘方法,通过组合疗法改善急性骨髓性白血病的治疗方案。
标题其实很有意思,研究者得到的基因集是 Predictive but Not Prognostic Biomarker!
本文介绍由美国俄亥俄州立大学医学院Qin Ma副教授团队和美国密苏里大学哥伦比亚分校许东教授团队联合发表在Nature Communications的研究成果。本文作者提出了scDEAL,这是一个通过整合大规模bulk细胞系数据在单细胞水平上预测癌症药物反应的深度迁移学习框架。scDEAL的亮点在于协调药物相关的bulk RNA-seq数据与scRNA-seq数据,并通过迁移学习把在bulk RNA-seq数据上训练的模型用以预测scRNA-seq中的药物反应。scDEAL的另一个特点是整合梯度特征解释来推断耐药机制的特征基因。作者在六个scRNA-seq数据集上对scDEAL进行了基准测试,并通过三个专注于药物反应标签预测、基因特征识别和伪时间分析的案例证明了模型的可解释性。作者相信scDEAL可以帮助研究细胞重编程、药物选择和再利用以提高治疗效果。
传统化疗是对抗癌症的常见方法,但它会攻击全身,造成不必要的副作用,如脱发,恶心和疲劳。 靶向治疗选择性地杀死癌细胞而不影响健康组织。靶向药物开发将成为治疗癌症的重要手段。 肿瘤的生物信息学数据库对肿瘤基础研究的发展、临床治疗水平提供具有重要作用。
我们在做细胞实验的时候,经常会有这样的疑虑,细胞被那么多人蹂躏了那么多次了,那我现在操作的细胞当时我以为的那个细胞系嘛?会不会有人在传代的时候不小心把这个细胞系的名字写成了另外的名字,然后就这样一直传下去了呢。
---------------------------------分割线------------------------------------
小编为大家爆肝整理了近百个数据库!共分10大类。今天第二期小编为大家分享后5类。 在整理的过程中,小编发现一些虽然是以前经常被大家推荐的数据库,但却已经不再维护了,早已不能正常使用了,这种数据库小编也已经贴心的帮大家过滤掉了。那就快来看看有没有你需要的吧!
Title:PROGENy: Pathway RespOnsive GENes for activity inference; 通路反应基因活性推断工具
褪黑素是一种内源性激素,在癌症中起着保护作用。褪黑激素除了调节昼夜节律、睡眠和神经内分泌活动外,还在各种生存途径中发挥作用。
还可以尝试一下同一个团队早在2014年就出品的R包之 pRRophetic ,也可以对你的表达量矩阵进行药物反应预测啦!很有意思的是这个包虽然是2014就发表了,文章是:《pRRophetic: An R Package for Prediction of Clinical Chemotherapeutic Response from Tumor Gene Expression Levels》
大家好!今天给大家解读一篇2022年1月发表在Genome Medicine(IF:11.117)上的文章。本研究通过对多个肺腺癌数据集进行分析,构建的2基因特征并确定L-score和S-score与肺腺癌患者预后和免疫治疗反应有关。
oncoPredict:一个用于预测体内或癌症患者药物反应和细胞系筛查数据的生物标志物的R包
主页: CGP website 是 Genomics of Drug Sensitivity of Cancer (GDSC)计划的数据
今天介绍中国科学院上海营养与健康所李虹团队在Briefings in Bioinformatics上发表的一篇论文,该文对深度学习药敏预测算法进行了综合评测。文章系统地评估了深度学习方法在预测癌细胞系和患者药物反应方面的性能,为用户根据自身需求和数据特点选择恰当的预测模型提供指导,同时为构建新的计算模型指引方向。
Large-Scale Characterization of Drug Responses of Clinically Relevant Proteins in Cancer Cell Lines
现在可以尝试一下理解药物预测的原理啦,首先呢在前面的教程 药物预测之相关性为什么不行,我们发现简简单单的表达量相关性居然都可以勉勉强强得到还算是合理的结果啊!现在让我们一起看看差异基因能不能进行药物预测!
DNA/RNA测序的最新进展实现了通过“精确”定位个性化疾病模块来快速识别新靶标并重新利用已批准的药物治疗异质性疾病。基因组学时代,药物开发已成为高度集成的系统性问题,互补多组学与计算方法成为新的研究范式,由于基因组学和系统生物学最新技术和计算方式的进步,使得利用导致人类疾病的癌症类型特异性机制来识别新靶向药物与治疗药物成为可能。基于网络的方法通过度量药物靶标与人类蛋白相互作用组中疾病蛋白的接近度,为药物重新定位靶标和联合疗法提供了可能性。
•IC50 (half maximal inhibitory concentration)最大半抑制浓度,可以用来衡量药物诱导凋亡的能力,即诱导能力越强,该数值越低;
今天跟大家分享的是七月份发表在Frontiers in Bioengineering and Biotechnology杂志(IF:3.644)上的一篇文章Characterization of Neoantigen Load Subgroups in Gynecologic and Breast Cancers,文章主要讲的是对TCGA的812个Pan-Gyn癌症样本,基于负荷百分比分成三个新抗原负荷亚组。然后分析这三个NAL亚组与基因表达、体细胞突变、DNA甲基化和临床病理信息的关联。通过不同的免疫细胞富集、PD-1信号和细胞溶解活性对每个亚组进行了表征。最后预测了每个亚组对化疗和免疫治疗的反应。
如果你觉得好的话,不妨分享到朋友圈。 摘要:生成对抗网络(GAN)是一类在无监督学习中使用的神经网络,其有助于解决按文本生成图像、提高图片分辨率、药物匹配、检索特定模式的图片等任务。Statsbot
选自StatsBot 作者:Anton Karazeev 机器之心编译 参与:乾树、黄小天 生成对抗网络(GAN)是一类在无监督学习中使用的神经网络,其有助于解决按文本生成图像、提高图片分辨率、药物匹
导读:生成对抗网络(GAN)是一类在无监督学习中使用的神经网络,其有助于解决按文本生成图像、提高图片分辨率、药物匹配、检索特定模式的图片等任务。Statsbot 小组邀请数据科学家 Anton Kar
肿瘤异质性对癌症的个性化诊断和治疗提出了挑战。癌症特异性生物标志物的鉴定方法对于癌症类型的诊断和治疗具有重要应用。在这项研究中,作者分析了来自 TCGA 和 GEO 的泛癌 DNA 甲基化数据,并提出了一种基于 G 蛋白偶联受体相关基因(GPCRs-related genes)的 DNA 甲基化水平来量化特异性程度的计算方法。并鉴定泛癌中的特定 GPCR DNA 甲基化生物标志物 (GRSDMs)。然后,使用基于岭回归的方法通过预测癌症样本的药物敏感性来发现潜在的药物。
生物医药是机器学习最重要的应用场景之一。但是生物医药涵盖各种各样的任务,数据非常的复杂,而且数据的获得和处理需要很多专业知识。这导致了很多机器学习的研究者只能在少量比较有名但是被研究的很多了的任务上做方法的研究,而忽略了大量的有意义的,但是非常的缺乏机器学习方法研究的任务。为了解决这个问题,我们一帮来自Harvard,MIT,Stanford,CMU,UIUC,Georgia Tech,IQVIA的学生和教授一起发起了Therapeutics Data Commons (TDC),第一个机器学习在生物医药的大规模数据集。TDC目前包含了20+有意义的任务,和70多个高质量数据集,从靶蛋白的发现,药物动力学,安全性,药物生产都有包含到。而且不仅仅是小分子,还有抗体,疫苗,miRNA等。之后也会加入CRISPR,Clinical Trials等等。这些数据都是处理成可以直接输入进机器学习模型的。而且大部分都是新坑!我们也提供了一些leaderboard来提供模型SOTA对比。欢迎大家使用TDC和提供建议!更多信息,请访问网站和GitHub!
通常是使用Cytoscape、igraph包等来可视化网络,虽然能够创建美观的网络图,但它们只是静态的。对于创建交互式网络可视化,可以使用R中的特定包—visNetwork,有许多参数来创建个性化网络。
本杂志开源(GitHub: ShixiangWang/weekly[1]),欢迎提交 issue,投稿或推荐生信相关内容。
尽管检查点阻断是治疗肝细胞癌 (HCC) 的一种有前途的方法,但尚未确定预期会出现反应的患者亚群。T 细胞介导的肿瘤杀伤 (TTK) 是免疫检查点抑制剂治疗的基本原理。
背景:目前大多数关于非小细胞肺癌(NSCLC)预后模型构建的研究仅涉及批量RNA-seq数据,而没有整合单细胞RNA-seq(scRNA-seq)数据。此外,大多数预后模型都是由预测基因构建的,忽略了其他预测变量,如临床特征。
这篇文章主要介绍在高通平台的CamX框架里面,如何去点亮摄像头马达,需要修改哪些相关的文件。
肺腺癌(LUAD)的基因组研究提高了我们对疾病生物学的理解,加速了靶向治疗。然而,人们对LUAD的蛋白质组学特性知之甚少。本研究通过对蛋白质组、磷酸化蛋白质组、转录组和全外显子组测序数据进行综合分析来揭示癌症相关特征,并指出三个亚型(S-I、S-II和S-III)与不同的临床和分子特征有关。
2024年4月13日,新加坡国立大学Yurui Chen等人在Bioinformatics上发表文章Hi-GeoMVP: a hierarchical geometry-enhanced deep learning model for drug response prediction。
编译|AI科技大本营(rgznai100) 参与 | 尚岩奇、周翔 生成式对抗网络(GANs)是一类用于解决无监督学习问题的神经网络,它们可以完成各种任务,例如通过描述生成图像,利用低分辨率图像还原出
据IBM的介绍,探索性数据分析(EDA)是数据科学家用来分析和研究数据集并总结其主要特征的一种方法,通常采用数据可视化技术。因此可以说,EDA 是通过创建可视化和摘要来研究和理解数据集的过程。
今天为大家介绍的是来自Angel Rubio团队的一篇论文。尽管深度神经网络(DDNs)在预测癌症药物疗效方面取得了成功,但其决策过程缺乏可解释性仍然是一个重大挑战。先前的研究提出模仿基因本体结构,以便解释网络中的每个神经元。然而,这些先前的方法需要大量的GPU资源,并且阻碍了其向全基因组模型的扩展。作者开发了SparseGO,这是一种稀疏且可解释的神经网络,用于预测癌症细胞系中的药物反应及其作用机制(MoA)。为了确保模型的泛化性,作者在多个数据集上对其进行了训练,并使用三种交叉验证方案评估其性能。该模型的高效性使其能够使用基因表达数据。此外,SparseGO结合了可解释人工智能(XAI)技术DeepLIFT和支持向量机,以计算方式发现药物的作用机制。与其他方法相比,SparseGO的稀疏实现显著减少了GPU内存使用量和训练速度,使其能够处理基因表达数据而不是突变数据。使用基因表达数据的SparseGO提高了准确性,并使其可以用于药物重新定位。此外,基因表达数据可以使用265种药物进行训练来预测其作用机制。
FraGAT: a fragment-oriented multi-scale graph attention model for molecular property prediction 论文摘要:
领取专属 10元无门槛券
手把手带您无忧上云