tcga使用教程_tcga数据库使用教程_tcga数据库的使用教程 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

TCGA数据库：miRNA数据下载与整理

关于miRNA的基础知识可参考文章：医学科研实验基础知识笔记（十一）:非编码RNA。

02

TCGA的28篇教程- 数据下载就到此为止吧

因为TCGA是一个史无前例的癌症研究项目，值得介绍的东西太多，不能在下载这个基础环境耽误太多的功夫，下载渠道再多，也只需要一个好用的即可！

03

您找到你想要的搜索结果了吗？

是的

没有找到

“散养”研究生的福音~科研之路必备工具~

http://www.chrislifescience.club:3838/R/AnnoE2/

01

小更新|Easy Tools v1.1.1 GeneInfo搜索可以不必准确输入基因名字，大小写都可以忽略哦～

只想用生信分析注释个基因，找找lncRNA，做个火山图图来展示结果，还不想学习写代码，怎么办？

03

鼠标点三次火山图就做成了，小站工具|Easy Tools v1.2更新啦，添加图像矢量图pdf下载，渲染速度更快，可指示基因哦~

只想用生信分析注释个基因，找找lncRNA，做个火山图图来展示结果，还不想学习写代码，怎么办？

01

小站工具|求解课题万能公式“A基因通过B通路调控C疾病的D功能”与模块使用教程~

3、依靠这样的公式，我们可以很轻松的提出国家自然科学基金的科学假说，也能屡清楚课题中的关键点。

01

零基础发文章神器系列一-UALCAN

最近小编在看单基因的分析文章，这些文章共通点多是利用公共数据库进行单基因数据挖掘。小编认为这个对于想发表文章，但是又苦无很好的生信基础的小伙伴是个很好的思路。同时也揭示出一个简单的却容易被忽视的真理-肿瘤数据库掌握得好，分析绘图“一锅烩”，徒手挖文章就不再是遥不可及的梦！

02

生信神器：零代码带你玩转癌症转移研究

HCMDB（人类癌症转移数据库）是一个集成数据库，可以存储和分析癌症转移的大规模表达数据。该数据库从GEO和TCGA中收集了124个先前公开的转录组数据集，用于比较转录组以检查转移相关基因的表达，在目前版本的HCMDB中，它包含来自四百多个实验的29种癌症类型。为了注释那些可能与转移相关的基因，数据库基于7,000多种已发表的文献，总共筛选了2183个基因（1901个蛋白质编码基因，24个长非编码RNA和203个miRNA）。

01

重磅！小站Easy Tools v1.1更新内容：火山图上线啦！当然这个也能提取LncRNA～更不用担心撞图，可以调配色的哦～

只想用生信分析注释个基因，找找lncRNA，做个火山图图来展示结果，还不想学习写代码，怎么办？

01

基因芯片数据分析（一）：芯片数据初探

简单地讲，基因芯片就是一系列微小特征序列的（通常是DNA探针，也可能是蛋白质）的集合，它们可以被用于定性或者定量检查样品内特异分子的成份。比如说，基因芯片可以检测几十个gene marker在细胞样品中的表达量。现在最常见的是用于整个基因组的表达量分析。它的雏形来自于同位素杂交技术，又如Southern blots或者dot blots。在上世纪九十年代，2维的具有现代意义的基因芯片才在实验室里诞生。基因芯片自问世以来，已经有超过23年（至2014年）了。现在，世界上主流的芯片制造商有4家，分别是Affymetrix，Agilent，Nimblegen以及Illumina。下图为历年来提交至Gene Expression Omnibus数据库的主流芯片厂商的芯片数据统计分布图（数据截止日期为2014年3月1日）。从下图中可以看出，Affymetrix制造的基因芯片在2008年以前占据了市场的主流，在2008年，因为illumina BeadArray的推广，它的市场份额有较大的攀升，但是2年以后就下降至与Affymetrix公司类似的份额。而Agilent却在2010年以后成为芯片市场份额最大的一家。市场份额的变化有价格的因素，质量的因素，使用习惯的因素，也有受到第二代测序技术冲击的因素。

01

TCGA数据挖掘（一）：TCGAbiolinks包介绍

肿瘤基因组图谱（TCGA）计划是由美国National Cancer Institute（NCI）和National Human Genome Research Institute（NHGRI）于2006年联合启动的项目，研究的癌症类型从最开始的多形性成胶质细胞瘤（GBM）到现在为止共有39种，涉及29种癌症器官，1万多个肿瘤样本，27万多份文件，当然其项目也将于2017年接近尾声。

08

GEO数据库简介

GEO 数据库全称是 Gene Expression Omnibus，是由美国国立生物技术信息中心NCBI 创建并维护的基因表达数据库。它收录了世界各国研究机构提交的高通量基因表达数据，目前已经发表的论文中涉及到的基因表达检测的数据可以通过这个数据库中找到,并且免费提供下载，对科研人来说真是非常友好的存在。

02

在Linux服务器里面安装GISTIC软件

GISTIC软件的使用有两个难点，一是在linux下面安装matlab工作环境，二是如何制作输入文件。

05

PanCanSurvPlot: 一款解决泛肿瘤KM生存分析的Shiny网页工具

PanCanSurvPlot (https://smuonco.shinyapps.io/PanCanSurvPlot/)

06

100篇泛癌研究文献解读之使用EXPANDS和PyClone量化肿瘤内部异质性

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹，加州举行的会议中发起了泛癌计划。参考：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在：TCGA知识图谱视频教程（B站和YouTube直达）

02

TCGA年度（共4年）研讨会资料分享

TCGA年度（共4年）研讨会PPT官网是： http://www.genome.gov/17516564

02

100篇泛癌研究文献解读之核受体基因家族探索

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹，加州举行的会议中发起了泛癌计划。参考：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在：TCGA知识图谱视频教程（B站和YouTube直达）

02

100篇泛癌研究文献解读之生存分析相关基因

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹，加州举行的会议中发起了泛癌计划。参考：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在：TCGA知识图谱视频教程（B站和YouTube直达）

08

TCGA的28篇教程-所以癌症的突变全景图

有了MAF格式的突变数据，比如TCGA里面的乳腺癌的1000个左右的样本的突变信息，就很容易走maftool这个包，进行绘图，代码如下：

03

100篇泛癌研究文献解读之癌症相关基因的饱和度分析

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹，加州举行的会议中发起了泛癌计划。参考：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在：TCGA知识图谱视频教程（B站和YouTube直达）

02

18-肿瘤突变负荷（TMB）的计算

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

02

100篇泛癌研究文献解读之微卫星不稳定性

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹，加州举行的会议中发起了泛癌计划。参考：https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在：TCGA知识图谱视频教程（B站和YouTube直达）

03

19-等位基因突变的肿瘤异质性（mutant-allele tumor heterogeneity，MATH）分数计算

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

02

生信爱好者周刊（第 23 期）：从美国博德研究所成功之道看生命科学前沿创新

2、Journal of Experimental & Clinical Cancer Research | scRNA-seq在癌症研究中的应用

02

生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

01

干货~Chris带你玩转TCGA~

那里的参数可以看下面这个网站https://bioconductor.org/packages/release/bioc/vignettes/TCGAbiolinks/inst/doc/query.html然后下载你要的数据

01

TCGA的28篇教程-早期泛癌研究

主要是研究肿瘤纯度，拷贝数变异，突变全景图，驱动突变，肿瘤异质性。我这里挑选第一个肿瘤纯度的泛癌研究进行解读：

03

TCGAbiolinks包下载TCGA数据进行表达差异分析-乳腺癌案例

TCGAbiolinks -一个用于TCGA数据综合分析的R/BioConductor软件包，能够通过GDC Application Programming Interface (API)访问 National Cancer Institute (NCI) Genomic Data Commons (GDC) ，来搜索、下载和准备相关数据，以便在R中进行分析。

拼凑6个网页工具图表还不够那就再加上6个组学

TCGA数据挖掘真的是绵绵不绝，这里就不再赘述了，从基因集到ceRNA，到可变剪切，肿瘤免疫，再到现在的m6A和自噬基因，马上缺氧,代谢应该是也要出来了，每次一个策略就是33篇数据挖掘文章。真的是很不走心，比如最近有学徒一直咨询我的m6A，我发现仅仅是ccRCC的就有4篇，有一个很简陋的文章，完全是6个网页工具图表拼凑的，再加上一点点多组学。

04

多测试几个数据集生存效应应该是可以找到统计学显著的！

就是一篇文章并没有使用TCGA数据库的指定癌症的生存信息去看自己感兴趣的基因的生存效应，反而舍近求远去下载BMC Cancer. 2011 文章数据，所以我怀疑TCGA应该是该基因在该癌症里面的生存效果不显著！

01

生信干货~TCGA转录组数据获得与分析方法

那里的参数可以看下面这个网站https://bioconductor.org/packages/release/bioc/vignettes/TCGAbiolinks/inst/doc/query.html然后下载你要的数据

02

给你tcga数据库过万病人的原始测序数据你可以做什么

大家应该是都知道，TCGA数据库是目前最综合最全面的癌症病人相关组学数据库，包括：

05

1行代码计算肿瘤突变负荷TMB

肿瘤突变负荷(TMB, tumor mutation burden)在生信数据挖掘领域是很古老的东西了，没想到还有人在用它进行各种分析...

04

cBioPortal数据库使用教程

大规模的癌症基因组计划，比如The cancer genome atlas(TCGA) and the International cancer genome consortium(ICGC)，正在从多技术平台产生更多的癌症基因组数据。这使得这些数据的整合，探索和分析越来越具有挑战性，尤其是对于没有计算机背景知识的科学家来说。cBioPortal是专门设计来降低对这些复杂数据的接近门槛，因此，促进基因组数据向新的生物学视野，治疗和临床特征的转变。

03

站长镜像：再次免费！只有一天~还不赶紧去下载TCGA转录组数据？”~分享关注公众号，回复：我要TCGA~

那里的参数可以看下面这个网站https://bioconductor.org/packages/release/bioc/vignettes/TCGAbiolinks/inst/doc/query.html然后下载你要的数据

02

count、tpm、fpkm等表达量差异

在进行差异分析、生存分析等下游分析时，有很多粉丝朋友对到底使用哪种类型的数据非常纠结，所以我们今天比较一下counts、tpm、fpkm、vst、cpm的表达量差异，让大家对这些数据类型有一个直观的感受。

03

生物信息数据分析教程视频——17-多种算法评估肿瘤免疫细胞浸润水平

生物信息数据分析教程视频——13-3种R包(DESeq2、edgeR和limma)进行RNAseq的差异表达分析与比较

05

1行代码提取6种TCGA表达矩阵和临床信息

之前的2行代码提取表达矩阵由于大家的R语言水平参差不齐，导致很多新手会报错，于是我把前面的代码打包为一个脚本，1行代码就可以了！

01

1行代码提取6种TCGA表达矩阵2.0版

之前写了一个脚本，可以让大家1行代码提取6种类型的表达矩阵以及对应的临床信息。但是很多人完全看不见注意事项或者根本看不懂，所以我决定改动一下。

02

TCGA的28篇教程-风险因子关联图-一个价值1000但是迟到的答案

其实那个需求很简单：https://www.ncbi.nlm.nih.gov/pubmed/24893932 文章里面也说的很清楚，如下：

03

生信小技巧第8课，加上 TCGA的28篇教程- 批量下载TCGA所有数据

（复制http://v.qq.com/x/page/v0666qu5y66.html这个链接在浏览器打开观看，当然，腾讯视频会给你看一分钟广告，而且需要自己选择超高清观看哦！！！）

03

maftools需要的文件如何自己整理

今天给大家演示下如何用自己的数据完成maftools的分析，主要是snp文件和临床信息的制作，其实很简单，但是网络上的教程都说的不清楚。

03

基于count数据的基因差异表达分析万能代码

关于差异分析的文章中【一文就会TCGA数据库基因表达差异分析】其实有推送过，这篇文章目前为止，有近千人付费学习。

01

肿瘤微环境看基质和免疫细胞就太泛了

实际上，这个方法还是过于粗糙了，肿瘤微环境的复杂程度，远不止基质和免疫细胞简单的归类。我随手查了一个比较新的综述文章：《Tumor microenvironment complexity and therapeutic implications at a glance》，链接是https://biosignaling.biomedcentral.com/articles/10.1186/s12964-020-0530-4，感兴趣的可以自己研读：

05

手把手学习TCGA数据库：SNP突变分析第四期

各位科研芝士的朋友，大家好，又见面了，今天我们的主题是利用cBioportal及UCSC-XENA数据库在线下载TCGA_SNP数据

05

pycharm安装2021_idea环境配置

很多新手朋友对PyCharm的使用无从下手，于是花费了一点时间整理这份PyCharm操作手册，

06

国产的内网穿透工具也很优秀，这10款工具推荐正在寻找的你！

内网就是你自己的网络环境，就你自己能访问，比如你本地测试进行的localhost；

国产的内网穿透工具也很优秀，这10款工具推荐正在寻找的你！

内网就是你自己的网络环境，就你自己能访问，比如你本地测试进行的localhost；

02

PyCharm使用教程 — 9、PyCharm中的搜索技巧（文件/函数/内容）「建议收藏」

很多新手朋友对PyCharm的使用无从下手，于是花费了一点时间整理这份PyCharm操作手册，

05

PyCharm使用教程 — 5、PyCharm的基本配置「建议收藏」

很多新手朋友对PyCharm的使用无从下手，于是花费了一点时间整理这份PyCharm操作手册，

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭