前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >R语言提取KEGG数据

R语言提取KEGG数据

作者头像
一粒沙
发布于 2021-03-11 07:09:36
发布于 2021-03-11 07:09:36
4.4K00
代码可运行
举报
文章被收录于专栏:R语言交流中心R语言交流中心
运行总次数:0
代码可运行

我们直奔主题,今天给大家介绍下利用R语言去下载KEGG数据库的所有数据。这里需要用到的包是KEGGREST。首先看下包的安装以及所需要的相关包:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
BiocManager::install("KEGGREST")
BiocManager::install("fmcsR")
devtools::install_git("https://github.com/cran/RbioRXN.git")

接下来我们直接通过实例来看下如何获取所有的数据:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##包加载
library(KEGGREST)
library(RbioRXN)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##查看KEGG数据库包含的数据
listDatabases()
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##获取单个数据集中的数据,
pathway<- keggList("pathway")
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##对单个数据库进行组织的选择
org <-keggList("pathway","hsa")

从上面可以看出keggList不仅可以提取单个数据集还可以获取对应物种的信息。在这里我们发现同样的通路编码ID却不一样,map+num泛指KEGG中的所有通路;has+num指的是人类物种的通路信息。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
##获取所有的代谢反应和化合物数据
keggAll = get.kegg.all()
save(keggAll,file="C:/data/metabolism/database/KEGG/keggAll.Rdata")
 
###提取数据
reaction=keggAll$reaction
write.csv(reaction," reaction.csv")
 
compound=keggAll$compound
write.csv(compound," compound.csv")

至此我们就可以将KEGG中的数据提取到本地进行接下来的分析处理。

欢迎大家学习交流!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 R语言交流中心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档