前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >零代码下载TCGA数据库第一期

零代码下载TCGA数据库第一期

作者头像
微点
修改2019-09-25 14:27:19
9370
修改2019-09-25 14:27:19
举报
文章被收录于专栏:sci666sci666

TCGA数据库目前是科研中最常用的数据库之一,其中储存着多种疾病的各组学的数据,借助该数据库,帮助了很多研究生们发表了自己的文章,达到了毕业条件。但是,如果你是刚入门的新手,不用担心,跟着我们的系列推文,完成TCGA数据库的认识与下载,开启TCGA数据库的大门。今天我们就来学习一下TCGA数据库中癌症的RNAseq数据下载。

1.TCGA数据库简介

TCGA数据库全称为The Cancer Genome Atlas,如名所示,它主要储存关于各类肿瘤的一个基本信息,包括RNAseq,miRNAseq,DNA甲基化,CNV,SNP等信息,它是目前为止我们可以获得的公开数据库里面数据相对全面的一个,在各个领域得到了广泛的应用,为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,这为挖掘有意义的基因组变化和发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。

2.TCGA网址

https://portal.gdc.cancer.gov/

首页模样如下:

3. 点击 Repository,进入数据存储地,就会出现下面这个界面

4. 点击 Case,选择疾病类型,就会出现下面这个界面,用于挑选各类癌症,比如我们选择喉癌(Larynx),在其前面打钩即可。

5.接着点击 File,选择文件类型,就会出现下面这个界面,用于选择需要下载文件的数据类型,因为我们需要下载的是RNAseq的数据,所以需要在Transcriptome Profiling,在其前面打钩即可。

6.在Data Type选择Gene Expression Quantification,在Experimental Strategy上由于只有一个选项,所以我们不用选择也可以,主要看到有三种类型,分别是counts,FPKM和FPKM-UQ,分别表示counts数和两种归一化后的值,一般推荐下载counts数据。

7. 点击counts之后,我们可以看到每一步操作都会记录在里面,如下,也可以看到数据大小是31兆。

8. 点击Add All Files to Cart,然后就会看到箭头所指的地方,变为相应的样本数,接着点击cart,如下:

9. 点击download,下载cart即可

这样你就完成了第一步基于网页版tcga数据的下载。

10.下载的数据模样

下载的结果是一个压缩包,我们解压之后就会发现,每个文件存储的为一个样本。

OK,今天的数据下载先讲到这,下期再见。

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档