前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >WGCNA如何从module中挖掘关键基因

WGCNA如何从module中挖掘关键基因

作者头像
生信修炼手册
发布于 2020-05-08 08:51:35
发布于 2020-05-08 08:51:35
2.8K00
代码可运行
举报
文章被收录于专栏:生信修炼手册生信修炼手册
运行总次数:0
代码可运行

欢迎关注”生信修炼手册”!

识别到与表型数据相关的modules之后,还可以在该modules中进一步筛选基因,为了方便筛选,对于每个基因定义了以下三个统计量

1. connectivity

连接度,在之前的文章中,简单提过这个概念,类似于网络中节点的degree的概念,只不过在加权共表达网络中,由于每条边代表两个基因间的相关性的大小,对应一个数值,所以一个基因在共表达网络中的连接度定义为与该基因相连的所有边的数值之和。

另外,根据相连的基因是否和该基因位于同一个module, 又可以将边分为两类,和该基因位于同一个module内,定义为within, 位于不同的modules, 定义为out。在WGCNA中,可以通过intramodularConnectivity函数计算连接度,用法如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 计算基因间的邻接值
ADJ1=abs(cor(datExpr,use="p"))^6#计算连接度
Alldegrees1=intramodularConnectivity(ADJ1, colorh1)

计算的结果如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> head(Alldegrees1)
kTotal kWithin kOut kDiff
Gene1 31.80186 28.37595 3.425906 24.95005
Gene2 28.88249 26.47896 2.403522 24.07544
Gene3 25.38600 23.11852 2.267486 20.85103

KTotal代表该基因的所有边的连接度,KWithin代表和该基因位于同一个module下的边的连接度,KOut代表和该基因位于不同module下的边的连接度,所以KTotalKWithinKOut之和,KDiff代表KWithinKOut的差值。

在module中,会存在hub gene的概念,所谓的hub gene, 就是该module下连接度最大的基因,注意此时只考虑位于该module下的边,就是上文的KWithin

2. module member-ship

简称MM, 将该基因的表达量与module的第一主成分,即module eigengene进行相关性分析就可以得到MM值,所以MM值本质上是一个相关系数,如果基因和某个module的MM值为0,说明二者根本不相关,该基因不属于这个module; 如果MM的绝对值接近1,说明基因与该module相关性很高。

在WGCNA中,计算基因与module之间的MM值的代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
datKME = signedKME(
datExpr,
datME,
outputColumnName="MM.")

第一个参数为基因表达量,第二个参数为Module Eigengene值,结果如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
> head(datKME)
MM.blue MM.brown MM.green MM.grey MM.turquoise MM.yellow
Gene1 0.6830511 0.11547756 -0.007124794 0.2840109 0.9481457 0.09588170
Gene2 0.6342657 0.02257975 0.080277091 0.3029967 0.9356343 0.06889483
Gene3 -0.6198067 -0.12531203 0.008372054 -0.2776929 -0.9121710 -0.17852211
Gene4 0.5966736 0.06469079 0.049862112 0.2671967 0.9052030 0.11707603
Gene5 0.6642214 0.14369720 -0.017975774 0.2442237 0.9017972 -0.01038067
Gene6 -0.6018161 -0.15167072 0.006667131 -0.2053897 -0.9192597 -0.17138960
3. gene signigicancer

简称GS, 将该基因的表达量与对应的表型数值进行相关性分析,最终的相关系数的值就是GS, GS反映出基因表达量与表型数据的相关性,计算GS的代码如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
GS1=as.numeric(cor(y,datExpr, use="p"))

通过以上三个量化指标,可以方便对module下的基因进行筛选。通常情况下,通过module和表型数据的相关性分析,我们可以筛选得到和感兴趣的某一表型相关的具体的modules,在该module下面深入挖掘基因时,可以通过MMGS两个指标作为过滤手段,示例如下

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
FilterGenes= abs(GS1)> .2 & abs(datKME$MM.brown)>.8

假设brown是我们找到的和表型高度相关的module, 其中的关键基因可以定义为和brown这一表型的GS值大于0.2,而且MM值大于0.8的基因。筛选出关键基因后,可以通过功能富集分析进一步挖掘其功能。

·end·

—如果喜欢,快分享给你的朋友们吧—

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信修炼手册 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
GEO_加权共表达网络WGCNA
WGCNA(Weighted Gene Co-Expression Network Analysis,即加权基因共表达网络分析)是一种用于分析基因表达数据的系统生物学方法。WGCNA的主要目的是识别基因表达数据中的共表达模块,并研究这些模块与外部样本特征(例如,疾病状态、临床特征等)之间的关系。
sheldor没耳朵
2024/07/25
3460
GEO_加权共表达网络WGCNA
WGCNA加权基因共表达网络一步法分析学习
WGCNA是一种用于分析基因表达数据的系统生物学方法。主要用于识别在基因表达数据中呈现共表达模式的基因模块,并将这些模块与样本特征(如临床特征、表型数据)相关联,进而识别关键驱动基因或生物标志物。
凑齐六个字吧
2024/08/31
2070
WGCNA加权基因共表达网络一步法分析学习
WGCNA-最短教程掌握高级分析
先给大家讲讲WGCNA的精髓,其实就一句话:关联表型和基因。WGCNA通过将基因进行分组(module),把基因模块和表型进行关联,实现了快速锁定核心基因的目的。
用户6317549
2019/12/30
3.8K0
生物信息数据分析教程视频——12-基因之间的相关性分析及可视化
视频地址:http://mpvideo.qpic.cn/0bc3niaasaaatialkbbtenrva2wdbfvaacia.f10002.mp4? 参考: 如何合理的展示相关性分析结果??
DoubleHelix
2022/12/15
1.3K1
生物信息数据分析教程视频——12-基因之间的相关性分析及可视化
听说WGCNA官网崩了?那还能做基因共表达分析吗?
http://www.genetics.ucla.edu/labs/horvath/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/index.html
生信技能树
2024/12/19
2160
听说WGCNA官网崩了?那还能做基因共表达分析吗?
RNA-seq入门实战(十一):WGCNA加权基因共表达网络分析——关联基因模块与表型
连续两次求贤令:曾经我给你带来了十万用户,但现在祝你倒闭,以及 生信技能树知识整理实习生招募,让我走大运结识了几位优秀小伙伴!大家开始根据我的ngs组学视频进行一系列公共数据集分析实战,其中几个小伙伴让我非常惊喜,不需要怎么沟通和指导,就默默的完成了一个实战!
生信技能树
2022/07/26
13.3K3
RNA-seq入门实战(十一):WGCNA加权基因共表达网络分析——关联基因模块与表型
一文看懂WGCNA 分析(2019更新版)
不过,我这点战绩根本就算不上什么,其实这个WGCNA包已经是十多年前发表的了,仍然是广受好评及引用量一直在增加,破万也是指日可待。
生信技能树
2019/09/30
30.4K2
一文看懂WGCNA 分析(2019更新版)
WGCNA得到模块之后如何筛选模块里面的hub基因
通常是介绍到,把输入的top5000 MAD的基因根据WGCNA算法划分为多个模块,然后不同模块都可以去和临床形状看相关性。
生信技能树
2020/02/20
15K0
WGCNA:带你飞的科研神器
这个软件从2008年发表至今(截止到2019-05-20)已经被引用3899次。可见这个包多么受欢迎。
作图丫
2022/03/29
1.3K0
WGCNA:带你飞的科研神器
WGCNA如何挖掘潜在的共表达基因
共表达基因指的是表达量具有协同变化趋势的基因集合,通常认为这些基因参与相同的生物学过程,比如参与同一个代谢通路,正是由于功能上的协同作用,导致表达量呈现出高度相关性。
生信修炼手册
2020/05/08
2.1K0
WGCNA如何挖掘潜在的共表达基因
WGCNA + ssGSEA的组合分析
生物信息数据分析教程视频——16-单样本基因集富集分析(ssGSEA)用于肿瘤相关免疫细胞浸润水平评估
DoubleHelix
2023/09/06
6970
WGCNA + ssGSEA的组合分析
RNAseq|WGCNA-组学数据黏合剂,代码实战-一(尽)文(力)解决文献中常见的可视化图
WGCNA (weighted gene co-expression network analysis)权重基因共表达网络分析(流程模块见下图),可将表达模式相似的基因进行聚类,并分析模块与特定性状或表型之间的关联,常用于筛选关键表型的hub基因 ,是RNAseq分析中的一块很重要的拼图。而之所以叫组学数据黏合剂是因为表型可以是患者的临床信息(生存信息,分期信息,基线信息等),可以是重测序信息肿瘤(驱动基因的变异与否,signature ,CNV信息等),可以是转录组结果(免疫浸润,risk score ,GSVA ,分子分型结果),可以是单细胞数据(celltype ,AUCell 打分)等等 。注:这些在公众号之前的文章中大多都有涉及,文末有部分链接。
生信补给站
2023/08/25
1K1
RNAseq|WGCNA-组学数据黏合剂,代码实战-一(尽)文(力)解决文献中常见的可视化图
WGCNA关键模块和hub基因筛选
WGCNA的理论背景知识 WGCNA的详细分析流程 关键模块和hub基因筛选,在流程中并不可知 模块划分好后如何找到key module
Y大宽
2018/10/11
6.2K0
通过WGCNA作者的测试数据来学习
在这样的测试数据里面很容易跟着作者的文档,一步步掌握WGCNA,文档步骤目录如下:
生信技能树
2019/09/30
1.2K0
通过WGCNA作者的测试数据来学习
WGCNA共表达网络分析-让你的文章闪耀起来
WGCNA(Weighted Gene Co-Expression Network Analysis)称为加权基因共表达网络分析是一种适合进行多样本复杂数据分析的工具,通过计算基因间表达关系,鉴定表达模式相似的基因集合(module),解析基因集合与样品表型之间的联系,绘制基因集合中基因之间的调控网络并鉴定关键调控基因。其适合应用于复杂的多样本转录组数据,是发表转录组高分文章的必备技能。
用户6317549
2019/11/26
4.3K0
非肿瘤简单生信加简单实验发3+分SCI!
今天和大家分享的是2019年12月发表在Annals of translational medicine(IF:3.297)上的一篇文章,“The application of weighted gene co-expression network analysis in identifying key modules and hub genes associated with disease status in Alzheimer’s disease ”,作者结合了微阵列数据和AD患者的临床数据进行了系统的WGCNA分析,识别与AD不同阶段临床特征有关的生物标志物,为AD的机制研究和临床决策提供了帮助。
科研菌
2020/11/23
1.1K0
非肿瘤简单生信加简单实验发3+分SCI!
WGCNA将共表达基因与表型数据相关联
单纯的共表达基因集合的结果并不能与我们的实验设计相关联,对于识别到的几十个共表达基因集合,一一进行富集分析去挖掘其功能,看上去如此的盲目,没有目的性,所以我们需要对共表达基因集进一步挖掘,常规的做法就是分析其中与性状相关的共表达基因,然后针对这些基因通过富集分析来研究其功能。
生信修炼手册
2020/05/08
2.7K0
WGCNA将共表达基因与表型数据相关联
七步走纯R代码通过数据挖掘复现一篇实验文章(第七步WGCNA)
WGCNA分析完全是照搬jimmy老师三年前的教程,要提醒大家的是要用别人的教程一定要看清楚别人数据格式,行名,列名,然后做成绝对一致的格式,这样会很大程度的减少报错!
生信技能树
2019/09/03
1.4K0
七步走纯R代码通过数据挖掘复现一篇实验文章(第七步WGCNA)
WGCNA实战练习
本文采用WGCNA官网的Tutirial 1的数据,对加权基因共表达网络分析和后续的数据挖掘的具体操作进行梳理, 数据可以从官网下载,示意图如下
生信修炼手册
2020/05/08
1.4K0
WGCNA实战练习
从原始芯片.cel数据到权重基因共表达网络(WGCNA)详细流程
看这个之前,可以先看WGCNA的一些理论背景知识 看完整个之后可以去看WGCNA关键模块和hub基因筛选
Y大宽
2018/10/11
3.3K1
从原始芯片.cel数据到权重基因共表达网络(WGCNA)详细流程
推荐阅读
相关推荐
GEO_加权共表达网络WGCNA
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文