我按照上面文章思路,写了TCGA数据分析部分的代码,当然模拟的数据不是文章的肿瘤数据,数据是TCGA-STAD转录组和临床的数据,分析的基因是我随便找的基因,所以结果没有那么好,只是一个处理流程而已,根据自己研究方向订呗。
代码包括了:
➢ 数据下载 ➢ 数据整理 ➢ ****(比如m6A)相关基因表达 ➢ ****(比如m6A)差异分析(参考文章)
➢ 临床数据下载和整理(参考文章) ➢ 肿瘤分型subtype
主成分分析
生存分析
临床相关性 ➢ 单因素COX分析 ➢ Lasso模型构建 ➢ 风险生存分析(R语言批量绘制生存曲线) ➢ ROC曲线 ➢ 风险热图(热图绘制:基因表达谱热图绘制) ➢ 独立预后分析
下面是我模拟数据自动分析结果
差异基因表达谱热图
肿瘤分型
相关性分析
主成分分析
肿瘤分型生存分析
分型与临床相关性热图
单因素COX分析
lasso回归
风险生存曲线
ROC曲线
风险与临床相关性热图
独立预后分析
下面是我跑的时候录下的视频,17分钟就跑完了整个流程
本文分享自 MedBioInfoCloud 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!