前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >合并新版TCGA表达矩阵R代码叒更新了—基因名字也给你提出来

合并新版TCGA表达矩阵R代码叒更新了—基因名字也给你提出来

作者头像
生信交流平台
发布2022-09-21 19:09:16
4160
发布2022-09-21 19:09:16
举报

TCGA数据库在2022年4月初进行更新之后,小编第一时间给大家展示了TCGA数据库的变化,用图文的方式详细介绍了新版TCGA数据库RNAseq数据下载方法。

TCGA数据库悄咪咪更新了—RNAseq没有HTSeq-Counts了

小编也针对新版TCGA数据库格式,为各位小伙伴提供了两种合并新版TCGA中RNAseq表达谱数据的方法

☞R代码合并新版TCGA数据库RNAseq表达谱数据

零代码合并新版TCGA数据库RNAseq表达谱数据

有小伙伴反馈,合并得到的矩阵里面只有ensembl gene ID,没有基因名字,不方便后续数据分析。

其实小编前面也给大家介绍过 【R语言】基因ID转换,所以将ensembl gene ID转换成gene symbol也是分分钟的事情。

今天小编要给大家介绍一个更简单的方法。其实新版TCGA数据库中的RNAseq数据是自带gene symbol的。仔细看,就在ensembl gene ID的旁边。惊不惊喜,意不意外!

所以小编又双叒叕更新了合并新版TCGA中RNAseq表达矩阵的R代码。在合并的函数中添加了一个参数,symbol,并且默认设置为TRUE。也就是说,这个函数在合并RNAseq表达矩阵的时候除了提取ensembl gene ID以后,也会提取相应的gene名字。

代码语言:javascript
复制
merge_TCGA <- function(metadata, path, data.type, mRNA_expr_type="STAR", symbol=T)

运行起来也很方便

代码语言:javascript
复制
RNA_STAR_Counts=merge_TCGA(metadata=metaMatrix.RNA, 
                     path="RNAseq", 
                     data.type="RNAseq",
                     mRNA_expr_type="STAR",
                     symbol = T
                     )

会得到下面的矩阵。注意:这里的gene名字是有重复的,不可以作为行名。

当然如果你不想要基因名字也是可以的,将symbol设置成 F即可。

代码语言:javascript
复制
RNA_STAR_Counts=merge_TCGA(metadata=metaMatrix.RNA, 
                     path="RNAseq", 
                     data.type="RNAseq",
                     mRNA_expr_type="STAR",
                     symbol = F
                     )

更新后的R代码+完整注释,下载地址参考☟☟☟

☞R代码合并新版TCGA数据库RNAseq表达谱数据

已付费用户可以通过原链接,直接下载更新后的代码。一次付费,享终生免费更新服务。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信交流平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档