学习
实践
活动
专区
工具
TVP
写文章

使用新姿势玩KEGG,是种什么体验……

这个标题应该配提问的小伙伴送给我的新年小礼物

有小伙伴说他要用gage这个包,因为可以选择sigmet这个index,然后得到的结果只有signaling and metabolic pathways,而不会有他不关心的disease pathways。然而也有各种不爽,他最喜欢的还是clusterProfiler,但没办法只做某些pathways。

我发现大家对clusterProfiler有各种误解,各种觉得没办法,我也很无语啊,明明我写了大量的文档,你们偏不看。clusterProfiler啥都可以做,你想做COG,domain这些没有内置支持的富集分析都可以的,因为clusterProfiler是通用的分析工具,啥都能做。

说到gage的pathway index,这其实是他们对pathway有个分类,这个数据就在https://pathview.uncc.edu/data/khier.tsv可以下载到,要支持他还不容易,但我不喜欢把别人的东西打包在自己的包里,所谓走别人的路,让别人无路可走,这可不是什么好主意。所以呢,我不会内置支持的,你们自己玩。

要玩这个,也很容易。无非是拿它的gene sets来做嘛。我们先来看看它分了什么类:

总共分了7个,信号通路类的,包括:

Genetic Information Processing

Environmental Information Processing

Cellular Processes

Organismal Systems

代谢通路类的,只有自己Metabolism,这也是KEGG最大的一个类别。而所谓的sigmet,就是信号通路+代谢通路。

疾病类的是Human Diseases,而drug development这一类别,gage也有拿出来给大家用。这样大家就知道大概怎么回事了。

赞赏是最好的支持!

那么怎么来和clusterProfiler衔接?gage的分析步骤首先就是准备gene sets,准备完之后,你就可以直接拿来用了,所以说我啥都不用干,本身就是支持的。

下面这个代码,把这个gene sets从list变成data.frame,然后我随机拿100个基因来做演示:

clusterProfiler提供了通用的enricher用于做ORA,和GSEA用于做GSEA,啥都可以搞,不要再以为只有GO和KEGG了,当然你也可以用enricher和GSEA来搞GO和KEGG。

看完还要看

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180227G00URE00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

关注

腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
腾讯云开发者公众号二维码

扫码关注腾讯云开发者

领取腾讯云代金券