TCGA 之前站长建好了三个服务器给大家免费使用,结果一天只有一个人在用好伤心~后来有小伙伴强力要求站长再来一个免费~嗯~好吧~站长再做一次免费~~~回复:我要TCGA。可获服务器IP及登录密码,下载你的TCGA吧~~~ps这次先准备一个服务器~拥堵再说~又ps这次镜像里有Y叔的ClusterProlifer~
有很多获得以及分析TCGA数据的方法比如解螺旋教程中的RTCGAToolbox大家可以去试一试这里我推荐选用的是TCGAbiolinks,原因就是用的舒服首先大家去安装source("https://bioconductor.org/biocLite.R")biocLite("TCGAbiolinks")下面想一个课题,比较一下TCGA数据库中AML(急性髓系细胞白血病)性别特异性差异表达基因翻译过来就是:找到转录组数据,按照男女对比一下,看看有哪些表达差异基因恩,这个课题是挺无聊的,不过没准有意外发现呢~~安装完了我们进行对下载数据库的参数设定
那里的参数可以看下面这个网站https://bioconductor.org/packages/release/bioc/vignettes/TCGAbiolinks/inst/doc/query.html然后下载你要的数据
然后获得这个叫SE的东西
获得临床资料和Counts
操作视频如下 然后就是一堆R语言的代码操作包括按照性别分个组 Deseq2分析前处理一下顺序,设置一下对照什么的有些基础的朋友就懂了~~也可参照下面的教程Deseq2分析差异基因 另外关于注释的时候需要提醒一下大家由于最新的TCGA绝大部分用的是hg38的注释,比较新了一些之前的例如下面教程的第一个方法就不适用了生信干货~ID(ENSGxx)转Gene name的方法~ 那么该怎么办呢?只能用第二种DIY的方法对于🌰课题中的数据结果,还是挺有意思的没想到除了那些Y染色体上的基因,还有其他表达差异的基因 TCGAbiolinks有可能会出现GDC server down的情况,用下面命令安装开发版即可解决 devtools::install_github(repo = "BioinformaticsFMRP/TCGAbiolinks") 如果还是安装失败,或者有bug,大家也可以像站长那样 在网页登陆云服务器去使用Rstudio+TCGAbiolinks+Y叔clusterProfiler 然后用fileZilla把数据传到自己电脑上 Rstudio+TCGAbiolinks+Y叔ClusterProfiler 已经做好了腾讯云镜像(北京), 小站所有已经加入Chris转录组初级教程星球的小伙伴,都可以免费共享, 需要的话发送腾讯云账户ID给站长微信即可~~~~ 之前站长建好了三个服务器给大家免费使用,结果一天只有一个人在用好伤心~ 后来又有小伙伴强力要求站长再来一个免费~ 嗯~好吧~ 站长再做一次免费~~~ 回复:我要TCGA。 可获服务器IP及登录密码,下载你的TCGA吧~~~ ps这次先准备一个服务器~拥堵再说~ 又ps这次镜像里有Y叔的ClusterProlifer~
主讲人,Chris LouChris生命科学小站创始人,神经外科医生,Wet-Dry实验兼修专业硕士毕业,还未考博。自研一开始研习国自然申报与撰写,撰写标书中面上中标3项,主持国家自然科学基金青年项目1项,发表SCI论文9篇,以第一作者发表SCI论文三篇,单篇最高10.02。 课程介绍如果你自己有测序结果想省点钱自己分析如果你想挖掘那些NCBI中RNA-seq原始测序数据如果你想预测某些基因下游的通路如果你已经学会了各种R语言教程但是发现服务器好贵那么,还等什么加入这个教程能够教会你,每个样本只花不到10元的价格。从这些数据
到下面这些图