前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >GO和KEGG富集分析及去冗余工具及原理

GO和KEGG富集分析及去冗余工具及原理

作者头像
Y大宽
发布2019-05-20 10:28:42
4.7K0
发布2019-05-20 10:28:42
举报
文章被收录于专栏:Y大宽

1 GO和KEGG富集分析工具:Clusterprofiler包和REVIGO

进行基因功能或生物学通路富集的工具或网站有很多。像DAVID、IPA、GATHE等。我基本采用基于R的Clusterprofiler包。该包抓取最新的KEGG数据进行计算,保证富集结果的可靠性。另外,该包还可以对富集结果进行比较并可视化具体参数设置为:p-value cutoff=0.01, q-value cutoff=0.05, p值矫正方法为BH(即把每个p-value进行矫正,转换为q-value)。

2 去冗余

因为GO条目的分级特性,其富集结果会有冗余,对结果的分析造成影响,其中一个策略是计算两个GO terms之间的语义相似性,去除冗余。 目前主要有两类方法:

2.1 计算语义相似性得分

基于它们的共有父条目的注释统计,计算语义相似性得分,包含Resnik、Lin、Jiang 和Schlicker四种方法;

2.2 基于GO图形结构

Wang提出基于GO的图形结构进行计算。

以上方法,各有利弊,而GOSemsim(GO semantic similarity)是ClusterProfilers包的作者Y叔开发的计算GO terms,sets of GO terms,gene Cluster语义相似性的包,并且提供上述的五种语义相似计算方法。我在进行GO terms集的相似性分析时,一般采取基于Resnik和Lin两种方法的综合方法,简称为simRel方法,利用REVIGO进行分析,然后基于R语言做图。

同样,具体代码和步骤以后再写,先放图

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019.05.19 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 GO和KEGG富集分析工具:Clusterprofiler包和REVIGO
  • 2 去冗余
    • 2.1 计算语义相似性得分
      • 2.2 基于GO图形结构
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档