看到了一个生物信息学数据挖掘,标题是:《Novel ferroptosis gene biomarkers and immune infiltration profiles in diabetic kidney disease via bioinformatics》,通过大量的数据分析拿到了11个FRDEGs基因列表,然后去对这11个基因进行“屎上雕花”,它们分别是: (ALOX5, CCL5, FHL2, G0S2,IGKC,KRT19,LCN2,LTF,PRKCB,RRM2,TUBA1A) ,比如下面的go数据库的注释结果,就使用了4种展示策略 :
go数据库的注释结果
本质上就是这11个基因以及其对应的go数据库通路列表名字而已,让我们使用示例数据来说明这个有多么的浅薄。只需要安装对应的包,就可以复制粘贴下面的代码到你的rstudio编辑器里面看图:
library(clusterProfiler)
library(org.Hs.eg.db)
data(geneList, package='DOSE')
head(geneList)
de <- names(geneList)[1:100]
enrichKK <- enrichKEGG(de, pvalueCutoff=0.01)
head(enrichKK)
colnames(enrichKK@result)
barplot(enrichKK)+dotplot(enrichKK)
需要大家肉眼看懂并且理解这个colnames(enrichKK@result)里面的结果,Kegg(京都百科全书与基因组数据库)注释是一种常用的生物信息学分析,它用于将基因与生物学途径和功能进行关联。Kegg数据库提供了丰富的信息,包括代谢途径、疾病、药物作用以及基因功能等。在你提供的信息中,各个列代表的含义如下:
Kegg注释的结果可以帮助研究人员理解基因在生物体中的作用,以及它们如何与疾病或其他生物学过程相关联。通过这些注释,研究人员可以识别关键的生物标志物、潜在的药物靶点,或者对生物学途径进行更深入的研究。
如下所示的kegg数据库注释结果就说明了目标基因(100个基因)及其对应的kegg数据库功能富集结果:
对应的kegg数据库功能富集结果
上面仅仅是可视化了最后的富集分析通路名字而忽略了里面的基因列表,其实是可以看清楚了每个具体的富集到的通路,比如上面的cell cycle通路有12个基因,但是背后到底是哪12个基因做贡献;
enrichKK=setReadable(enrichKK,'org.Hs.eg.db',keyType = 'ENTREZID')
tmp=head(enrichKK[,c(4,10,11)])
理论上看下面的图表信息是最好的,但是大家就会要求把这个表格也是展现出来:
这个时候有3种可视化方法:
cnetplot(enrichKK, categorySize="pvalue", foldChange=geneList,colorEdge = TRUE)
cnetplot(enrichKK, foldChange=geneList, circular = TRUE, colorEdge = TRUE)
heatplot(enrichKK)
大家可以复制粘贴代码去试试看,说一下自己喜欢哪个,我个人比较倾向于第二个 :
如果要做的文章里面的弦图,就需要使用其他包了,比如下面的两个:
library(RCircos)
library(circlize)
使用上面的数据,然后绘制一个类似的弦图,这个时候需要使用另外一个基因列表,如下所示200个基因 :
de <- c(
head(names(geneList),100),
tail(names(geneList),100)
)
因为这里面的geneList是一个差异分析结果,里面的基因按照变化倍数是排序好的。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有