下面是赵婧的分享
TCGA 数据下载
今天听完生信技能树的TCGA课程后,尝试完成课程作业,通过GDCRNATools下载TCGA数据的时候出现了以下的报错:
最开始我还以为是我的网络不好,折腾半天无果,便到群里向小伙伴求助。然后小洁老师@小洁忘了怎么分身 热心的指了一条明路——那就是这个包已经过期了,需要去官网下载gdc-client。那我们就动起来吧!
gdc-client软件安装和配置
- 下载软件地址:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool,根据自己的操作系统下载对应的版本,这里下载Mac版本。
- 将下载的软件解压,并放在一个自己好找的目录,例如我放在了Documents/TCGA数据下载中
下载数据
- 在GDC官网:https://portal.gdc.cancer.gov 中找到自己所需要的数据,比如HNSC的miRNA数据。然后下载Manifest到刚刚软件放置的目录
- 先点击Exploration,然后在左侧选取需要的癌症类型和项目,选好后点击View Files in Repository
- 然后就会跳转到Repository页面,可以在这里进一步筛选所需要的数据。选择好之后点击Add All Files to Cart, 然后可以在右上角的cart中看到添加了多少个文件。如果不要下载其他的数据了,就可以直接点击Manifest,下载到Documents/TCGA数据下载中。
- 然后打开终端,在终端输入
./gdc-client download -m gdc_manifest.2020-08-11.txt -d ./HNSC/ 就开始下载啦~
就完美解决了问题, 其实生信技能树以前也分享过,但是如果没有这次课程,讲师和助教们的悉心指导,真的很难在知识的海洋里面遨游!