首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

TCGAGTEx数据库基因表达分析资源:GEPIA

导语 GUIDE ╲ GEPIA (Gene Expression Profiling Interactive Analysis) web服务器是2017年推出,是基于TCGAGTEx数据库中肿瘤正常样本进行基因表达分析一个资源...数据库介绍 GEPIA2具有198 619种isoforms(功能上相似的蛋白质,具有相似但不完全相同氨基酸序列,由不同基因编码,或由去除不同外显子相同基因RNA转录本编码)84种癌症亚型,从基因水平扩展到转录本水平将基因表达量化...此外,GEPIA2采用了受单细胞测序研究启发基因特征量化分析技术,提供定制分析,用户可以上传自己RNA-seq数据,并与TCGAGTEx样本进行比较。...选择要测试模型,会通过每个子类型样本得到一个概率矩阵。要求上传基因表达谱应该是带有Hugo基因名称TPM值。...建议上传由XENA pipeline处理表达文件,由GEPIA使用。 04 数据资源 这里展示了GEPIA2中可用TCGA/GTEx数据量。在组织标本tab中,进行了肿瘤与正常比较。

2.7K20
您找到你想要的搜索结果了吗?
是的
没有找到

GEPIA2详解(中国智造-肿瘤数据库)

图片来源:GEPIA2 作者:李瑞萌 审校:Jimmy GEPIA2 是北京大学张泽民老师实验室开发一个网站,能够对TCGAGTEx项目共9736个肿瘤样本、8587个正常样本RNA-seq表达数据进行分析...7 Similar Genes Detection 在 "TCGA Tumor", "TCGA Normal" 或者 "GTEx"样本中,搜索具有相似表达特征基因、isoform或者signature...8 Dimensionality Reduction 输入要研究基因列表,选择感兴趣"TCGA Tumor", "TCGA Normal" 或者 "GTEx"样本集以及其他参数,就会得到2D plot...并且,基因isoform表达谱数据也可以与TCGAGTEx数据进行比较。 ?...01 下载数据并读入R中 (1) 从UCSC xena下载表达量数据临床信息 首先,下载UCSC Toil RNA-seq Recompute数据。 ?

9.9K61

「R」一个函数获取 TCGACCLE 单基因分子数据

这样即使用户无需加载 Shiny,也能够简单自在下载 癌症单基因数据了。 ❝这里单独说 TCGA 不太全面,实际包含了 TCGA TARGET GTEx 3 个数据库,它们是个体水平数据。...第 2 个是数据类型,包括基因表达(gene),转录本表达(transcript)、突变(mutation)、拷贝数变异(cnv)甲基化(methylation),默认是基因表达。...第 3 个是数据库,包括 toil(包括上面提到 TCGA 等几个个体水平数据) ccle。 使用 了解函数参数后,使用就根据自己所需就行了。如果还不懂,可以不断试错。...1787-01" "TCGA-S9-A7J2-01" "GTEX-QV31-1626-SM-2S1QC" ... #> $ unit : chr "log2(tpm+0.001)" 可以查看部分数据...我们再看下它 CNV 突变情况。

90010

TCGAGTEx泛癌数据也是1行代码整理

TCGAGTEx泛癌数据分析也是生信数据挖掘必备技能,目前最好用泛癌数据肯定是XENA网站上整理好啦。我们直接下载用即可。...:mRNA样本信息整合到一起数据,行是样本,列是基因,前2列是sample_idsample_type TCGA+GTEx pan-cancer TCGAGTEx并不是一对一关系,如下图所示(...这个对应关系表可以在GEPIA网站免费下载),TCGA很多project在GTEx里是没有对应样本,并且GTExTCGA是1对多关系哦~ 如果是需要TCGA+GTEx泛癌数据,那就需要同时提供...8个rdata文件外,还会得到另外2个整合好TCGA+GTEx数据: TCGA_GTEx_pancancer_lncRNA_pheno.rdata:TCGAGTEx整合到一起lncRNA表达矩阵样本信息...前4列是样本信息,后面的列是lncRNA TCGA_GTEx_pancancer_mRNA_pheno.rdata:TCGAGTEx整合到一起mRNA表达矩阵样本信息,注意:行是样本!

43950

GEPIA:TCGAGTEx表达谱数据分析平台

GEPIA整合了来自TCGAGTEx项目中基因表达谱数据,提供了多种数据分析可视化功能,操作简单,方便广大科研人员对肿瘤表达谱数据进行挖掘,对应文章发表在Nucleic Acids Research...无论是哪种可视化方式,都是用于直观查看肿瘤正常个体间该基因表达量差异。 2....Differential Genes 该部分分析在特定肿瘤中正常样本肿瘤样本中差异表达基因,可以自己定义差异基因分析算法对应阈值,示意如下 ?...PCA 这部分进行PCA分析,指定多组样本,然后根据输入基因表达量进行PCA分析,可以生成2D3D PCA图,结果如下所示 ? ?...其核心差异分析生存分析等功能,已经可以满足绝大多数TCGA数据挖掘需求,多种可视化结果更是锦上提花。如果只是对肿瘤表达谱数据进行挖掘,GEPIA可以称得上是最简便平台。

1.2K30

生物信息数据分析教程视频——07-TCGA数据库:基因表达探索

)] # ###在TCGA中没有正常样本,但可以匹配GTEx数据库中正常样本癌症类型 # proj4 <- c("TCGA-ACC","TCGA-LGG","TCGA-OV","TCGA-SKCM...","TCGA-TGCT","TCGA-UCS" ) # ###在TCGA中正常样本大于0小于10,但可以匹配GTEx数据库中正常样本癌症类型 # proj5 <- c("TCGA-CESC","TCGA-GBM...","TCGA-PAAD") # # ###在TCGA中正常样本大于0小于10,在GTEx数据库中也没有正常样本癌症类型 # proj6 <- c("TCGA-PCPG","TCGA-SARC","...filter = FALSE) ##过滤不表达基因 tpm <- tpm[apply(tpm,1,var) !...) + # geom_boxplot(aes(fill = Sample), show.legend = FALSE, width = 0.6) + #绘制箱线图展示肿瘤组织正常组织两组基因表达整体分布

65220

生物信息数据分析教程视频——17-多种算法评估肿瘤免疫细胞浸润水平

生物信息数据分析教程视频——04-TCGA数据库中SNVCNV数据下载 生物信息数据分析教程视频——05-TCGA数据库中甲基化数据下载整理 生物信息数据分析教程视频——06-GEO数据库中芯片数据下载整理...生物信息数据分析教程视频——07-TCGA数据库:基因表达探索 生物信息数据分析教程视频——08-TCGA+GTEx数据库数据整理 生物信息数据分析教程视频——09-TCGA+GTEx数据库联合表达分析...——13-3种R包(DESeq2、edgeRlimma)进行RNAseq差异表达分析与比较 生物信息数据分析教程视频——14-芯片数据表达差异分析 生物信息数据分析教程视频——15-clusterProfiler...FALSE) ##过滤不表达基因 tpm <- tpm[apply(tpm,1,var) !...#Parameters #sample_expression: Sample expression profile in FPKM, TPM format by RNA-seq or log2-transformed

1.2K50

生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估

生物信息数据分析教程视频——01-TCGA数据库RNAseq数据下载与整理 生物信息数据分析教程视频——02-TCGA数据库miRNA数据下载与整理 生物信息数据分析教程视频——03-有关TCGA数据库临床数据问题...生物信息数据分析教程视频——04-TCGA数据库中SNVCNV数据下载 生物信息数据分析教程视频——05-TCGA数据库中甲基化数据下载整理 生物信息数据分析教程视频——06-GEO数据库中芯片数据下载整理...生物信息数据分析教程视频——07-TCGA数据库:基因表达探索 生物信息数据分析教程视频——08-TCGA+GTEx数据库数据整理 生物信息数据分析教程视频——09-TCGA+GTEx数据库联合表达分析...——13-3种R包(DESeq2、edgeRlimma)进行RNAseq差异表达分析与比较 生物信息数据分析教程视频——14-芯片数据表达差异分析 生物信息数据分析教程视频——15-clusterProfiler...gene_type", filter = FALSE) ##过滤不表达基因 tpm <- tpm[apply(tpm,1,var) !

79010

TCGA28篇教程-GTEx数据库-TCGA数据挖掘好帮手

通常我们在挖掘TCGA数据库时候,会发现该项目纳入正常组织测序结果是非常少,也就是说很多病人都不会有他正常组织转录组测序结果,比如说乳腺癌吧,1200个左右转录组数据,其中1100左右都是肿瘤组织测序数据...这个时候我们就需要想办法加大正常组织测序样本量,既然TCGA数据库没有,我们就从其他数据库着手。...研究联盟研究收集并研究了来自449名生前健康的人类捐献者7000多份尸检样本,涵盖44个组织(42种不同组织类型),包括31个实体器官组织、10个脑分区、全血、两个来自捐献者血液皮肤细胞系,作者利用这些样本研究基因表达在不同组织个体中有何差异...RNA editing in mammals”论文,采用GTEx数据探讨了与基因表达相关联基因变异如何能够调节RNA编辑X染色体失活现象。...如果真的要把GTEx数据库转录组表达矩阵TCGA进行比较,还需要一定程度去除批次效应。 我以前在生信技能树多次讲解,这里也不再赘述。

9.2K62

RNA-SeqCountsFPKM数据如何转换成TPM

TCGA数据库中下载RNA-Seq数据就有2种形式,raw counts FPKM,尽管有很多文章是直接利用FPKM进行分析,但是FPKM存在不准确性,通常我们会使用TPM。...什么是TPM?我在前面的文章中就有介绍:RNA-seqcounts,RPM, RPKM, FPK值到底有什么区别?。...那么我们如何将这些数据进行转换成TPM数据呢?read countFPKM结果都可以转成TPM,但是因为FPKM跟TPM计算都考虑了基因长度,所以从FPKM转TPM最方便快捷。...具体可参考前面的文章:RNA-seqcounts,RPM, RPKM, FPK值到底有什么区别?,这里提供是R代码。 首先我们得有FPKM数据,这里我以之前TCGA数据库数据为例。...数据可在文章【TCGA数据库33个ProjectRNA-Seq转录组数据为你整理打包好了】中下载。

24.3K53

每周文献分享第一季完结撒花暨第65期分享

今天,第一季生信菜鸟团每周文献分享项目正式落幕,第二季就在不远处,我们会用更好形式方式回归。在接下来一段时间,将会有一系列范癌TCGA专题文献分享在每周六大家见面。 祝阅读愉快,一切顺利。.../articles/s41598-020-59516-z figure 文章介绍: TCGAGTEX是两个超级大拥有RNA-seq数据计划,其中TCGA涵盖33种癌症,超1万个样品,而GTEX也有...它们各自发起单位对RNA-seq数据处理不一样,而且后续也有一些新流程处理试图统一两个数据库RNA-seq数据分析结果,比较出名5个是: TOPMed pipeline (https://github.com...5个流程应用到TCGAGTEX,得到10个不同组合数据 GDC (GDC-Xena/Toil, GDC-Piccolo, GDC-Recount2, GDC-MSKCC and GDC-MSKCC...GTEx (GTEx-Xena/Toil, GTEx-Recount2, GTEx-MSKCC, GTEx-MSKCC Batch) 做了非常完善比较,并且公布全部代码在:https://github.com

56140

一个基因引发血案

而Gepia生存分析用到也是490个病人。 ? 看来可能是因为Normal组引起差异。查看了Gepia数据库来源: ? 除了TCGA,Gepia还采用了GTEx样本,GTEx是个啥?...再看一下oncomine (Oncomine 整合了GEO、TCGA已发表文献来源RNADNA-seq数据),不同文章对这个基因表达情况?结果如下: ? 大牛们数据基本支持上调趋势!...没细读,文章大意是:当不同数据源进行差异比较时候(如对GTExTCGA数据),不能直接拿来比,需要用某种方法进行uniform进行标准化,balabalabala… ?...文章作者最后说我们成功整合了GTExTCGA数据,现在可以做比较了! 这篇文章发表在2018年,后于Gepia开发。...过程不详述,大概如下: 从USCS下载了TCGA前列腺癌基因表达数据(550个样本)临床病人数据。

73341

使用gtex数据库找组织特异性表达基因

数据库 数据量可以说是很可观了,前面我们介绍过很多了:TCGA28篇教程-GTEx数据库-TCGA数据挖掘好帮手 一期 2015年,GTEx发布了第一个阶段性成果,一次性在Science杂志上发表三篇研究成果...GTEx研究从175名死者身上采集到了1641个尸检样本,这些样本来自54个不同身体部位,对几乎所有转录基因基因表达模式进行了观察,从而够确定基因组中影响基因表达特定区域。...研究联盟研究收集并研究了来自449名生前健康的人类捐献者7000多份尸检样本,涵盖44个组织(42种不同组织类型),包括31个实体器官组织、10个脑分区、全血、两个来自捐献者血液皮肤细胞系,作者利用这些样本研究基因表达在不同组织个体中有何差异...RNA editing in mammals”论文,采用GTEx数据探讨了与基因表达相关联基因变异如何能够调节RNA编辑X染色体失活现象。...top 50 表达基因功能 我看到:https://gtexportal.org/home/topExpressedGenePage 可以搜索,比如我搜索大脑最高表达量基因,发现它的确可以把大脑区域身体其它区域很容易分开

3.2K30

生信如何巧妙利用circRNA发3分+

上述circRNA相互作用对可能参与了肝癌发生发展。 摘要 背景:环状RNA(circRNA)是一种新型非编码RNA,在癌症发病机理发展中起着至关重要作用。...miRNAmRNA表达谱从TCGAGTEx数据库获得。 通过qPCR验证了微阵列结果。基于circRNA-miRNA对miRNA-mRNA对,构建了ceRNA网络。...CircRNA-miRNA-hub基因网络构建及hub基因功能富集分析 基于| log2FC | > 1且FDR <0.05时,作者从TCGA-LIHCGTEx数据库中总共获得了2135个差异表达...首先,使用venn图分析(下图A)展示了TCGAGTEx106个circRNA相关靶基因2135个DEG,并生成了7个常见靶基因DEG(CITED2,ACSL4,MARKS,KIF5B,AURKA...进一步使用EdgeR软件在TCGAGTEx数据中验证了7个hub基因表达水平,发现与正常组织相比,肿瘤组织中AURKA,KIF5BRHOA上调,如下图F所示。 ?

2.3K21

RNA-seqcounts值,RPM, RPKM, FPKM, TPM 异同

标准化主要目的是去除测序数据技术偏差:测序深度基因长度。 测序深度:同一条件下,测序深度越深,基因表达read读数越多。...RPKM与FPKM区别:RPKM值适用于单末端RNA-seq实验数据,FPKM适用于双末端RNA-seq测序数据。...TPM计算方法也同RPKM/FPKM类似,首先使用式2计算每个基因表达值,去除基因长度影响。随后计算每个基因表达量百分比,最后再乘以10^6,TPM可以看作是RPKM/FPKM值百分比。...TPM与RPKM/FPKM区别:从计算公式来说,唯一不同是计算操作顺序,TPM是先去除了基因长度影响,而RPKM/FPKM是先去除测序深度影响,具体可看这篇博文,有计算步骤详细说明;TPM实际上改进了...A review of RNA-Seq expression units http://www.rna-seqblog.com/rpkm-fpkm-and-tpm-clearly-explained/

27K43
领券