我们直奔主题,今天给大家介绍下利用R语言去下载KEGG数据库的所有数据。这里需要用到的包是KEGGREST。首先看下包的安装以及所需要的相关包:
BiocManager::install("KEGGREST")
BiocManager::install("fmcsR")
devtools::install_git("https://github.com/cran/RbioRXN.git")
接下来我们直接通过实例来看下如何获取所有的数据:
##包加载
library(KEGGREST)
library(RbioRXN)
##查看KEGG数据库包含的数据
listDatabases()
##获取单个数据集中的数据,
pathway<- keggList("pathway")
##对单个数据库进行组织的选择
org <-keggList("pathway","hsa")
从上面可以看出keggList不仅可以提取单个数据集还可以获取对应物种的信息。在这里我们发现同样的通路编码ID却不一样,map+num泛指KEGG中的所有通路;has+num指的是人类物种的通路信息。
##获取所有的代谢反应和化合物数据
keggAll = get.kegg.all()
save(keggAll,file="C:/data/metabolism/database/KEGG/keggAll.Rdata")
###提取数据
reaction=keggAll$reaction
write.csv(reaction," reaction.csv")
compound=keggAll$compound
write.csv(compound," compound.csv")
至此我们就可以将KEGG中的数据提取到本地进行接下来的分析处理。
欢迎大家学习交流!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有