首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

新年迎财神的正确方式

初五迎财神,晦气去去去,事业顺顺顺,运道旺旺旺,新年发发发!

最骚不过中西合璧呀!

要说生物医学界的财神,个人以为TCGA数据库算一个,毕竟给广大人民群众带来了无数的数据和文章!今天就给大家扒拉扒拉TCGA数据库的正确打开方式。TCGA,The cancer genome altas,https://cancergenome.nih.gov/

TCGA的里蕴藏着大量的数据,但是如何获取这些数据,成为了第一道门槛。之前给大家介绍过生信人开发的简易TCGA数据下载的小工具这么好用的TCGA数据下载工具?!,工具还是相当给力的,但是如若要进一步筛选想要的样本,又或者说有些肿瘤的数据下不下来(比如AML的),那还是得用到TCGA自带的下载工具。

我们首先在TCGA网站里勾选好想要下载什么样的样本,以及数据类型(比如是RNA-seq的count数据,或者是临床信息)

选好之后下载Manifest

然后打开GDC Apps下载TCGA官方的下载工具

解压之后就这么一个文件,我们把刚才下载的Manifest也保存在这个文件夹里

打开命令提示符cmd

然后在DOS界面里进入到刚才那个文件夹,我是放在D盘里的,所以先输入D:进入D盘,如果放到E盘里就输入E:

如果是放到C盘里,就输入CD..,退回到C盘的最初目录

接下来复制这个文件夹的地址(在地址栏右键鼠标)

粘贴过来之后

改成下图这样,cd\表示进入该目录

然后输入以下命令:

gdc-client download -m gdc_manifest.2018-02-20.txt

即可开始下载

其中gdc_manifest.2018-02-20是那个manifest的名字,但是切记要加上文件后缀——.txt

下载好的文件就在当前文件夹里了

觉得这个方法太复杂了?好吧,教你个傻瓜的。。

UCSC Xena (https://xenabrowser.net/heatmap/)

先选数据集

输入感兴趣的基因列表

我比较憨,我对自己芯片结果里所有的差异基因都感兴趣,所以我就把整个差异基因的Gene list搬运到了这里。右边这个表可以和左边的一毛一样,也可以随便填一下。

数据量大了,自然就会很卡,毕竟1000X1000的矩阵。。。所以最好还是悠着点,不要像我这样划船不靠桨全靠浪。

右上角可以下载数据结果,也可以下载热图的PDF,和基因表达数据的矩阵文件

在弹出无数次的以下页面后,我终于把自己浪死了!

所以还是不要用力太猛,悠着点,我们减少点基因数量重新来过。。。

下载的PDF结果

TSV文件刚包含了基因表达信息和对应的样本信息矩阵,走过TCGA分析流程的童鞋就会知道,能一下子得到这下面这张表格是多么方便的一件事情!节省了多少工作量!

好了!今天两个TCGA的工具——TCGA自带下载工具GDC Apps和UCSC Xena就介绍到这里了!祝大家文章基金全都有,金银财宝滚滚来!

关注后获取《科研修炼手册》1、2、3、4、5、6,基金篇精华合集

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180220G0DZGP00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券