前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >UCSC数据库下载TCGA数据需要注意的细节

UCSC数据库下载TCGA数据需要注意的细节

作者头像
DoubleHelix
发布2020-08-20 15:04:53
4.4K1
发布2020-08-20 15:04:53
举报
文章被收录于专栏:生物信息云生物信息云

前面关于TCGA的教程我介绍很多,包括数据下载和一些简单的分析以及数据的处理,这里介绍还是介绍数据的下载,前面介绍过从网页下载后直接整理,或者利用R包下载,这里介绍基于TCGA数据开发的一些工具——UCSC。从UCSC下载TCGA数据比较简单。

UCSC主页:https://xenabrowser.net

更多数据库,阅读文章【【收藏】生物数据库大合集

这是一个在线工具,可以在线分析数据,这里不介绍,只介绍下载数据。在首页左上角选择DATA SETS。我们就会看到该数据库的数据集。也可以直接通过下面链接直达:https://xenabrowser.net/datapages/

往下拉,就可以看见TCGA的数据集。

我随便选择一个, GDC TCGA Lung Adenocarcinoma (LUAD),我们进去就可以看到各种数据。

比如选择RNASeq是数据

就可以看见数据的详细信息,在download处的链接就可以下载数据了。这里的FPKM数据进行了log2(fpkm+1)转换,需要注意。你自己可以把他转换回来。就连counts的数据也进行了log2转换,按照数学公式转换会回去就不是整数了,许多包的分析是基于counts数的,需要整数,这点需要注意。当然,这些数据之间是可以转换的,可参考文章:

【1】RNA-seq的counts,RPM, RPKM, FPK值到底有什么区别?

【2】RNA-Seq的Counts和FPKM数据如何转换成TPM?

其他数据下载也是一样的,需要注意的是看描述信息,该数据库对数据进行了怎样的处理。还有就是时间,我们可以看到上面的数据是2019年7月份的,RNAseq数据,甲基化数据等时间上没有影响,因为这些就算TCGA数据库更新,它也不会变,重要的是临床数据,如果需要最新的临床数据,还是从官网下载临床数据。因为临床数据是不断变化的

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-08-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 MedBioInfoCloud 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档