前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >手把手教你画双基因生存曲线

手把手教你画双基因生存曲线

作者头像
百味科研芝士
发布2019-12-17 16:30:12
2.6K6
发布2019-12-17 16:30:12
举报
文章被收录于专栏:百味科研芝士
科研芝士的小伙伴们你们好啊~前几天看文献的时候看到一个双基因联合分组的生存曲线的图,觉得挺有意思的。今天我就以TCGA库中的乳腺癌(BRCA)为例,教大家怎么画双基因的生存曲线~

一、安装和加载所需的包

RTCGA是一系列根据数据类型分离的包,相当于要先下载这些离线数据R包之后再直接从离线数据包里面获取TCGA的所有数据。最新的版本可以加载下图所有的包,可谓是非常强大了。

infoTCGA看到各种肿瘤的各种数据那是相当的丰富。

二、从TCGA数据库上获取乳腺癌

的临床数据

至此便获得了乳腺癌的临床数据。从图可以看出该数据集一共有1098个样本。

三、从TCGA数据库上获取乳腺癌

相关基因的表达数据并整合

加载基因表达数据所需要的包。选择需要的GeneA和GeneB整合到之前的生存数据上。值得注意的是这里的%>%是一个管道符号,作用是将前一个计算得到的结果作为第二个函数的第一个参数。dplyr包是 Hadley Wickham (ggplot2包的作者,被称作“一个改变R的人”)的杰作,他将原本plyr 包中的ddply()等函数进一步分离强化,专注接受dataframe对象, 大幅提高了速度, 并且提供了更稳健的与其它数据库对象间的接口。

此时得到的exprSet如图:

四、开始生存分析

下面便是全文的关键。如何分组仁者见仁智者见智。我这里新建了一列用来标记基因表达高低。应该是比较通俗易懂的方法。

此时由于整合的缘故,数据框只剩590个样本。如图,最后一列为分组的标志。

最后就是常规的ggsurvplot画图。小伙伴们也可以用help命令仔细阅读该包的使用方法,做出你所需要格式的图片,这里就不再赘述。

至此,双基因的生存曲线就画完了。总的来说,双基因的生存曲线和单个基因的差别不大,重要是分组的思路。可能小伙伴们也有别的方法,欢迎在评论区里留言提出你的看法和问题哦~ 后台回复关键词:双基因,领取代码。

如果你有生信需求,也可以联系小编分析哦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-12-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 百味科研芝士 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档