大家好!今天跟大家分享的是2020年9月发表在Genomics(IF =6.205)上的文章。文章利用了从TCGA数据库中搜集的上皮性卵巢癌(epithelial ovarian cancer,EOC)表达谱数据进行了免疫相关基因表达分析,利用Cox回归分析及Lasso算法分别针对总体生存期(OS)和无病生存期(DFS)构建了免疫基因相关特征模型,并通过验证数据集进行了验证,后续利用CIBERSORT算法和免疫相关基因表达情况进一步分析了模型与肿瘤微环境的关系,为EOC提供了的潜在预后指标和治疗靶标。
看自己感兴趣的基因在自己研究的癌症的预后相关性是高频需求,其实就是拿到基因在癌症病人的表达信息,然后就可以根据表达量高低对病人进行分组,最后这个分组是否统计学显著的把病人的生存情况区分开来。
用在线xena下载数据,直接下载临床信息,全部都是整理好的,分14个数据集的和19个数据集的,19的那个。
生存分析一般来说是针对RNA表达数据,可以说mRNA-seq的转录组数据,也可以说miRNA-seq数据,或者基因表达芯片的表达量值。
针对免疫检查点(ICPs)的药物已经成为癌症免疫治疗中最流行的武器,然而只对一小部分患者有实际效益。越来越多的证据表明肿瘤免疫微环境在癌症免疫中起着关键作用。
作者首先对TCGA的转录组数据进行评估,使用CIBERSORT在22个免疫细胞表型中筛选与预后相关的5种免疫细胞。再对两组独立的标本进行5种细胞的免疫组化,构建免疫表型,预测MIBC患者的生存和复发。
II/III 期非小细胞肺癌 (NSCLC) 的预后即使在完全肿瘤切除和辅助化疗后也不令人满意。具有高免疫原性的肿瘤被定义为“热肿瘤”,并与免疫疗法的临床益处相关。
临床试验终点(End Point)服务于不同的研究目的。在传统的药物的研发中,早期的临床试验目的是评价安全性以及药物的生物活性,如肿瘤缩小。后期的有效性研究通常评价药物是否能提供临床获益,例如生存期延长或症状改善等。
线图(AlignmentDiagram),又称诺莫图(Nomogram图),它是建立在多因素回归分析的基础上,将多个预测指标进行整合,然后采用带有刻度的线段,按照一定的比例绘制在同一平面上,从而用以表达预测模型中各个变量之间的相互关系。其优势在于可以直接利用图形推算出某变量的取值,如患者的指标得分或生存概率等。它在医学领域中的应用由来已久,常见的有百分位列线图和概率列线图等。百分位列线图是确定个体某指标的测量值在总体中的百分位数;概率列线图是确定某个体特定事件的发生概率,该特定事件可以是疾病的发生、复发以及预后(如死亡)等,往往由多因素二分类回归或COX比例风险模型求得。列线图是回归方程结果的可视化,常用于逻辑回归或COX回归的结果展示,依据回归的结果,按照特定的比例画出多个线段,通过做图能够便捷地推算出某个体的发病风险或生存概率。
癌症的免疫景观越来越被认为是影响疾病进展、预后和治疗反应的关键特征。作者试图全面表征原发性口腔鳞状细胞癌(OSCC)中肿瘤浸润性免疫细胞(TIIs)的模式,并开发免疫特征衍生的模型,用于预后和治疗预测。
真核生物RNA可以携带100多种化学修饰,其中RNA甲基化修饰约占60%,而N6-甲基腺嘌呤(m6A)在甲基化修饰中最为普遍,占有率高达80%。从2017年至今,RNA m6A研究热度不减,已有7篇在《Nature》、2篇在《Cell》、2篇在《Cancer cell》上发表。
今天为大家介绍的是来自 Guoxin Li和Ruijiang Li团队的一篇论文。目前研究人员已经在利用深度学习进行医学图像中的癌症检测和诊断方面取得了实质性的进展。然而,在治疗反应和预后的预测方面取得的成功有限。目前基于数据驱动的深度学习模型在临床转化方面存在一个重要障碍,即缺乏解释性,这通常是由于与潜在的病理生物学之间存在脱节所致。在这里,作者提出了一种生物学引导的深度学习方法,可以同时从医学图像中预测肿瘤免疫和基质微环境状态以及治疗预后。
人体由数万亿个细胞组成,每天有数百万个细胞死亡。这些决定人体细胞命运的自然过程可以被广泛地定义为程序性细胞死亡(细胞凋亡和自噬)和非程序性、被动的细胞死亡(坏死)。人类固有的遗传多样性和属于这些细胞死亡途径的mRNA的差异表达可以在临床上提供可操作的信息。
CDCA4(细胞分裂周期相关蛋白4)参与细胞周期调节,是癌症的潜在的生物标志物。
临床试验终点(End Point)服务于不同的研究目的。在传统的肿瘤药物的研发中,早期的临床试验目的是评价安全性以及药物的生物活性,如肿瘤缩小。后期的有效性研究通常评价药物是否能提供临床获益,例如生存期延长或症状改善等。
这个问题怎么说呢,生命科学领域的数据挖掘课题的发表主要是靠工作量,很少有新颖或者前沿,无非就是替换癌症替换分子替换生物学功能基因集,我整理过大家耳熟能详的策略,有:
结直肠癌是发达国家中最常见的肿瘤之一,尽管治疗和诊断有所改善,但患者的死亡率仍然很高,这表明迫切需要新的生物标记物来正确识别需要进行特殊治疗的高危患者。最近的研究表明,端粒蛋白TRF2在结直肠癌中过表达,并通过端粒外功能促进肿瘤形成和发展,TRF2还会调节由VEGF-A介导的血管形成。
大家好,今天和大家分享的是2020年3月发表在Cancer genetics(IF=3.105)上的一篇文章:“Heterogeneity of MSI-H gastric cancer identifies a subtype with worse survival”,作者通过生信分析手段将MSI-H胃癌数据分为了两个亚组,并进一步使用了基因集富集分析等多种方法,探究了两个亚组在临床特征,预后情况,肿瘤免疫等因素之间的差异,并探讨了MSI-H1亚组预后较差的原因。
这篇生信论文是单基因分析的生信论文。单纯生信数据库的数据分析,没有湿实验验证,发表在接近4分+的期刊上。
大家好,本期给大家推荐的文献是Differentially Expressed lncRNAs in Gastric Cancer Patients: A Potential Biomarker for Gastric Cancer Prognosis,发表在Journal of Cancer杂志上,影响因子3.182。这篇文章主要是研究胃癌患者中差异表达的lncRNA,通过构建一个预测模型,来找出与胃癌预后相关的lncRNA。
大家好,今天和大家分享的是2020年发表在Theranostics(IF=8.579)上的一篇文章:“Plasma protein-based signature predicts distant metastasis and induction chemotherapy benefit in Nasopharyngeal Carcinoma”。作者利用液体活检技术对鼻咽癌患者与健康人的血浆蛋白进行了测定和对比,筛选出了与肿瘤转移相关的蛋白signature,并证明其可用于诱导化疗获益的预测。
在小编的印象中,2年前纯生信文章要是发5分以上还是比较容易的。However,不知什么时候,某个审稿人大脑抽筋,要求做实验来验证,现在的纯生信文章想突破5分还是不容易啊!那么今天,我们就来欣赏这个复旦小哥哥生信文章的魅力吧!文章是今年7月15日发的(最新啊!),题目如下:
随着单细胞数据文章发表得越来越多,单纯的依靠单细胞挖掘,虽有亮点,但是难度貌似越来越大。但是我们就止步了嘛?咱们就一个字:漏!正所谓蹭热度、强强联合,单细胞结合当今研究热点“自噬”,或许可以给我们带来新的思路。在pubmed上搜索相关关键词,目前只有2篇文章发表,毕竟是换一个癌种就可能发表,老铁们还在等什么咩?
肺腺癌(LUAD)的基因组研究提高了我们对疾病生物学的理解,加速了靶向治疗。然而,人们对LUAD的蛋白质组学特性知之甚少。本研究通过对蛋白质组、磷酸化蛋白质组、转录组和全外显子组测序数据进行综合分析来揭示癌症相关特征,并指出三个亚型(S-I、S-II和S-III)与不同的临床和分子特征有关。
本次文献解读涉及到三篇文章。这里要解读的第一篇是创建数据集的文章,后面的两篇文章在第一篇文章的数据集基础上进行了探索。
右删失数据:在随访中,观察起始时间已知,但终点事件的发生时间未知,无法获取具体的生存时间,这种类型的生存时间称为右删失。右删失是实际研究中最常见的数据删失类型。进行生存分析需要标准的分析方法,常见于临床肿瘤学的试验报告论文中。
各位小伙伴们大家好,这次给大家分享一篇2019年3月发表在EBioMedicine杂志上的,影响因子6.68的文献。题目是Integrative analysis of h-prune as a potential therapeutic target for hepatocellular carcinoma。文章主要是研究h-prune这个基因在肝细胞癌(HCC)中的临床意义及潜在调控机制,从全基因组层次对h-prune基因进行全面研究。
李白遇到一个酒店,原来瓶子的酒量就会翻倍。遇到一个公园就会喝掉一斗的酒,原来最开始酒瓶子里面有2斗水,最后一个经过的地方是公园,公园的个数有10个,酒店的个数为5个,例如babaabbabbabbbb就是一个行走过程,满足经过所有地方之后,李白恰好将所有的酒全部喝完。其中b表示遇到的是公园,a表示遇到的是酒店。求所有可行的方案数量,不需要记录每个方案到底是咋样。
作者刻画了结直肠癌(CRC)的免疫表型和抗原基因组特征,描绘了肿瘤和免疫细胞的关系,试图揭示肿瘤的逃逸机制并寻找免疫治疗的biomarker。
我们经常用随机森林等机器学习又或者是其他数据挖掘的方法寻找某些疾病的biomarker或者候选基因。但是来自临床的数据包括了生存事件等信息,数据的内容有所不同,所以需要一些和之前不太一样分析方法,其中常见的就是通过制作生存曲线图获取结论。
而如何高效使用计算机,好的代码必不可少~~~对于R语言来说,至少要搞定循环并行与Lasso结果收集。Daying出品的cirlasso,只要60元,让计算机帮助人类完成两年的运算~~
(HNSCC)从Cancer Genome Atlas下载(TCGA)数据库(https://gdc-portal.nci.nih.gov/)。根据口腔的解剖学定义,387个口腔样本(336个OSCC样品和51个正常对照样品) 从587个HNSCC数据中提取。 mRNA和miRNA表达数据包括327个OSCC样本和31个非癌样本已下载。原始lncRNAs和mRNAs 数据(HUGO基因命名委员会(HGNC)数据库 (http://www.genenames.org/)包含2775个lncRNA和19004他们的靶mRNA。
MRD 的概念最早在白血病诊疗中提出,是指白血病诱导化疗完全缓解(complete response, CR)后(或者骨髓移植治疗后),在体内残留少量白血病细胞的情况,用于预测复发风险和指导后续治疗。MRD 的表述包括三种,分别为可测量残留病灶(Measurable Residual Disease)、微小残留病灶(Minimal Residual Disease)及分子残留病灶(Molecular Residual Disease)。在实体瘤中,通常使用分子残留病灶的概念,其具体定义可概述为:经过治疗(通常为根治性治疗)后,传统影像学(包括 PET/CT)或实验室方法不能发现,但通过液体活检发现的癌来源分子异常,代表着肿瘤的持续存在和临床进展可能[1]。
今天和大家分享的是20年9月发表在cancers (Basel). (IF:6.126)杂志上的一篇文章,“Cancer-Specific Immune Prognostic Signature in Solid Tumors and Its Relation to Immune Checkpoint Therapies”,本篇研究中分析了4个单细胞RNA-Seq数据集和20个TCGA bulk RNA-Seq数据集中的免疫功能相关基因,使用了无监督聚类区分出主要的免疫功能类型。然后结合弹性网络回归和KM分析在不同肿瘤类型中确定了155个预后相关基因,并构建了癌症特异性预后免疫评分模型,最后使用了五种肿瘤的免疫检查点封锁疗法的公开数据进行模型验证。
人工智能(AI)在医学影像诊断中的成功应用使得基于人工智能的癌症成像分析技术开始应用于解决其他更复杂的临床需求。从这个角度出发,我们讨论了基于人工智能利用影像图像解决临床问题的新挑战,如预测多种癌症的预后、预测对各种治疗方式的反应、区分良性治疗混杂因素与进展,肿瘤异常反应的识别以及突变和分子特征的预测等。我们综述了人工智能技术在肿瘤成像中的发展和机遇,重点介绍了基于人工的影像组学方法和基于深度学习的方法,并举例说明了它们在决策支持中的应用。我们还解决了临床应用过程中面临的挑战,包括数据整理和标注、可解释性以及市场监管和报销问题。我们希望通过帮助临床医生理解人工智能的局限性和挑战,以及它作为癌症临床决策支持工具所能提供的机会,为他们揭开影像组学人工智能的神秘面纱。
分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析;
头颈鳞状细胞癌(HNSCC)是全球人类最常见的第六大恶性肿瘤,每年约有60万例新诊断病例。超过50%的HNSCC的患者被诊断时处于晚期,晚期HNSCC预后较差,治疗方法有限。免疫治疗由于其安全性和不良反应较少,可能会对晚期HNSCC患者产生更好的治疗效果
她上一个笔记是:学徒数据挖掘之谁说生存分析一定要按照表达量中位值或者平均值分组呢?
Lnc2Cancer 3.0由哈尔滨医科大学李霞老师和宁尚伟老师课题组开发,发表在2020年10月13日发表在Nucleic Acids Research杂志上。
标题其实很有意思,研究者得到的基因集是 Predictive but Not Prognostic Biomarker!
原发性肺淋巴上皮瘤样癌(pLELC)是一种罕见的非小细胞肺癌(NSCLC)亚型。
发表于:Clin Cancer Res. 2015 Apr 文章题目是:Comprehensive Genomic Analysis Identifies Novel Subtypes and Targets of Triple-negative Breast Cancer 主要是考虑到TNBC是异质性较大的一种乳腺癌,而且预后非常差,所以临床用药指导急需对TNBC本身更加细致的分类,研究团队通过贝勒医学院分两次 收集了 198个TNBC病人, (discovery set: n=84; validation set: n=114) 比较稳定的把TNBC分成了4个亚型,而且还分析了7个公共数据集来验证其结论。作者整理的4个亚型以及其可能的靶点:
因为大多数研究都集中在肿瘤的内在致癌通路上,所以在肿瘤免疫微环境(TIME)中m6A甲基化的潜在作用仍然难以捉摸。在本文中,作者系统地研究了769例头颈部鳞状细胞癌(HNSCC;Cancer Genome Atlas [TCGA],n = 499;GSE65858,n = 270)中重要的m6A调节因子与PD-L1和免疫浸润的相关性。PD-L1表达显然与m6A调节因子有关。通过15个m6A调节因子的一致性聚类确定了两个分子亚型(cluster1 / 2)。cluster2优先与预后良好,PD-L1表达上调,更高的免疫评分和明显的免疫细胞浸润相关。G2M检查点,mTORC1信号和PI3K / AKT / mTOR信号的标志在簇1中显著富集。使用七个与m6A调节因子相关的信号构建了预后风险评分,这些信号代表HNSCC的独立预后因素。与高风险患者相比,低风患者表现出更高的免疫评分和PD-L1表达上调。一致地,在外部GSE65858队列中,m6A调节因子对免疫调节和存活表现出相同的影响。进一步的分析表明,基于m6A调节因子的特征与TIME有关,并且它们的拷贝数变化会动态影响浸润肿瘤的免疫细胞的数量。本文的研究共同阐明了m6A甲基化在HNSCC中的重要作用。基于m6A调节因子的特征可能充当HNSCC中TIME的关键,代表改善免疫治疗功效的有希望的治疗靶标。
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!有做ngs实战整理的,也有做临床数据挖掘算法工具介绍的。今天分享的是复旦大学和西北民族大学小伙伴合作的笔记
MRD是什么?英文有3种描述,包括Molecular residual disease分子病灶残余)、Mesurable residual disease(可测量的病灶残余)以及Minimal residual disease(微小病灶残余)。顾名思义,MRD描述的是一种病灶的残余状态。影像学包括PET-CT发现不了的病灶,MRD可以监测到。
1、集群启动后,可以查看文件,但是上传文件时报错,打开web页面可看到namenode正处于safemode状态,怎么处理?
图的基本概念与图的基本表示 图的表示可以看我的前一篇文章 这里采用邻接表的方式来表示一个图无向无权图。
热休克因子1(HSF1)在癌症的启动、发展和进展中发挥了重要作用,但目前还没有对HSF1的泛癌分析。
控制大脑自发活动中的动态模式的机制尚不清楚。在这里,我们提供的证据表明,在超低频率范围内(<0.01-0.1Hz)的皮层动力学需要完整的皮层-皮层下通信。利用静息态功能磁共振成像(fMRI),我们确定了动态功能状态(DFSs),在超低频率下同步的短暂但周期性的静止区域簇。我们观察到,皮层簇的变化与皮层下簇的变化在时间上相一致,皮层区域与边缘区域(海马体/杏仁核)或皮层下核(丘脑/基底神经节)灵活同步。中风引起的局灶性病变,特别是那些基底神经节/丘脑和皮质之间的白质连接,引起DFSs之间的时间分数、逗留时间和转换的异常,导致异常网络整合的偏向。卒中后2周观察到的动态异常会及时恢复,并有助于解释神经功能损伤和长期预后。
领取专属 10元无门槛券
手把手带您无忧上云