首页
学习
活动
专区
工具
TVP
发布

Y大宽

专栏作者
185
文章
545983
阅读量
83
订阅数
WGCNA的理论背景知识
WGCNA是一种从大量数据中挖掘module的算法,而这些module所包含的gene为一组表达模式类似或这说表达谱相似的基因,也就是相关或不相关。 而正相关还是负相关可以由WGCNA的参数进行设定,默认是既包括正相关又包括负相关。 相似的表达模式可能意味着 -1 tightly co-regulated -2 functionally related -3 members of the same pathway 和聚类有一定的相似,但更具有生物学意义。 WGCNA对基因间表达量的相关系数取n次幂,使得相关系数数值的分布逐渐符合无尺度分布,按gene表达模式进行分类,将模式相似的gene归一一个模块module,而不是一般的cluster,因此WGCNA得出的结果有更高的可信度。把几个模块筛选出来了,模块中的gene也就知道了,这样,可以用这些结果分析出更多的意义。 在co-expression 网络中,每一个gene在一个特定时间或空间的表达情况可以看成一个点node,可以通过计算任何两个gene间的相关系数可以得到gene间的表达情况。第i个和第j个gene的pearson相关系数,即表示两个gene的表达相似性。可以通过设定一个阈值来确定两个gene之间的表达谱是否相似。达到这个阈值了就认为它们之间是相似的。这种方式的缺点就是,假如定义了0.8,那么0.79和0.81就是两个不同的范畴了。WGCNA通过软阈值避免这一问题。 网络的数学名称是图,图论中每一个节点node有一个概念,那就是度degree,一个点的度指的是图中该点所关联的边数edge。 scale-free network特点是存在少数节点,具有明显高于一般点的度,也就是并不是平均分布,这些点称为hub,由少数hub与其它节点关联,构成真哥哥网络。这样的无尺度网络的节点读书与具有该度数的节点个数服从幂分布,这就为寻找最佳参数提供了理论依据。 进化的过程中,生物选择了这种网络有其进化意义。整个生物网络中,少数的关键性的gene执行主要功能,只要保证hub的完整性,整个生物网络就不会坍塌,那生命体系就不会受太大影响。 WGCNA的详细流程 WGCNA关键模块和hub基因筛选
Y大宽
2018-10-11
1.1K0
基于RNA-seq的共表达网络分析工具
Methods and tools for RNA-seq-based co-expression network analysis 可以说是非常非常全面,从质量控制开始到最后都有介绍 原始
Y大宽
2018-09-10
7860
cBioportal中文教程
大规模的癌症基因组计划,比如The cancer genome atlas(TCGA) and the International cancer genome consortium(ICGC),正在从多技术平台产生更多的癌症基因组数据。这使得这些数据的整合,探索和分析越来越具有挑战性,尤其是对于没有计算机背景知识的科学家来说。cBioPortal是专门设计来降低对这些复杂数据的接近门槛,因此,促进基因组数据向新的生物学视野,治疗和临床特征的转变。
Y大宽
2018-09-10
4.6K0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
【玩转EdgeOne】征文进行中
限时免费体验,发文即有奖~
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档