首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

WGCNA分类性状处理

这篇推文主要探讨下WGCNA如何处理分类性状。...之前已经演示过WGCNA实战了:WGCNA实战:识别免疫相关lncRNA eigengenes可以代表某个模块,在计算出模块的eigengenes后,下一步就是探索eigengenes和性状之间的关系,...(虽然很多文章中都这样用) 如果是有序多分类,比如治愈、好转、未愈,这种,可以变成数字1,2,3,或者变成因子型; 如果是无序多分类,那么此时需要使用WGCNA提供的函数进行处理。...假如我们有一个无序分类变量x,它有3组: library(WGCNA) x <- rep(c("A","B","C"), each = 3) x ## [1] "A" "A" "A" "B" "B"...比如,对于我们之前用过的datTraits这个性状数据,我们假设其中的stage和msi是无序多分类变量,然后对这两个变量进行转换: load(file = "../000files/<em>wgcna</em>-02-

27720

WGCNA分类性状处理

这篇推文主要探讨下WGCNA如何处理分类性状。...之前已经演示过WGCNA实战了:WGCNA实战:识别免疫相关lncRNA eigengenes可以代表某个模块,在计算出模块的eigengenes后,下一步就是探索eigengenes和性状之间的关系,...(虽然很多文章中都这样用) 如果是有序多分类,比如治愈、好转、未愈,这种,可以变成数字1,2,3,或者变成因子型; 如果是无序多分类,那么此时需要使用WGCNA提供的函数进行处理。...假如我们有一个无序分类变量x,它有3组: library(WGCNA) x <- rep(c("A","B","C"), each = 3) x ## [1] "A" "A" "A" "B" "B"...比如,对于我们之前用过的datTraits这个性状数据,我们假设其中的stage和msi是无序多分类变量,然后对这两个变量进行转换: load(file = "../000files/<em>wgcna</em>-02-

20640

WGCNA的理论背景知识

WGCNA是一种从大量数据中挖掘module的算法,而这些module所包含的gene为一组表达模式类似或这说表达谱相似的基因,也就是相关或不相关。...而正相关还是负相关可以由WGCNA的参数进行设定,默认是既包括正相关又包括负相关。...WGCNA对基因间表达量的相关系数取n次幂,使得相关系数数值的分布逐渐符合无尺度分布,按gene表达模式进行分类,将模式相似的gene归一一个模块module,而不是一般的cluster,因此WGCNA...WGCNA通过软阈值避免这一问题。 网络的数学名称是图,图论中每一个节点node有一个概念,那就是度degree,一个点的度指的是图中该点所关联的边数edge。...WGCNA的详细流程 WGCNA关键模块和hub基因筛选

1.1K31

WGCNA实战:识别免疫相关lncRNA

前面的推文给大家介绍了3种识别免疫相关lncRNA的方法:免疫相关lncRNA的识别 今天再给大家介绍下如何使用WGCNA识别免疫相关lncRNA,也算是WGCNA的实战教程。...WGCNA可以看做是一种筛选候选分子的方法,也可以是识别特定性状相关分子的方法,还可以看做是一种降维方法。 WGCNA的原理和入门教程我们就不讲了,大家自己学习一下,直接进入实操。...如果是分类数据需要都变成数值型(因子型也可,以后再专门讨论这个问题),其实WGCNA包中还介绍了其他方法,以后我们专门再写一篇推文比较下。...挑选软阈值 # 加载数据 rm(list = ls()) load(file = "wgcna-01-dataInput.rdata") 软阈值一般要求R^2在0.9以上,最小也要在0.8以上。...提取感兴趣的基因(lncRNA) 上面的几个步骤其实是WGCNA的核心步骤,剩下的其实都是基于上面这个结果的个性化分析。

33130

WGCNA-最短教程掌握高级分析

上期【高阶】WGCNA共表达网络分析-让你的文章闪耀起来中,我们给大家讲解了WGCNA的基本理论和其中的一些基本的概念,很多同学已经迫不及待想要学习整个WGCNA的分析流程了。...我们比较了很多网络上的教程,发现大多数文章都是翻版WGCNA官网中的分析流程去做,并没有把WGCNA的精髓给讲清楚。而且很多文章把整个分析流程讲的异常繁琐,让很多同学看了就望而却步。...于是,我们决定在这篇文章中,通过一个简化的步骤把WGCNA给大家彻底讲透,让大家上手就能做。本文代码见文末,联系客服领取。 ? WGCNA的目的 ?...先给大家讲讲WGCNA的精髓,其实就一句话:关联表型和基因。WGCNA通过将基因进行分组(module),把基因模块和表型进行关联,实现了快速锁定核心基因的目的。 ? WGCNA的步骤 ?...WGCNA需要读入的数据有两个: 基因表达谱数据 样本表型数据 我们采用WGCNA的示例数据来给大家进行解读。

2.6K22

这个WGCNA作业终于有学徒完成了!

前些天我布置了WGCNA的作业:下载GSE106292 数据集的 Excel表格如何读入R里面,做出作者文章中那样的图,但是收到的作业中,有好几个同学都是搞不清楚文中的WGCNA针对的5个分组到底是什么.../Rpackages/WGCNA/faq.html 文章中关于进行WGCNA之前的数据为TPM数据(如下图所示),根据一文看懂WGCNA 分析(2019更新版):如果是芯片数据,那么常规的归一化矩阵即可...') load('wgcna_input.Rdata') 得到的样本聚类树可以看到,没有明显的离群样本,因此不需要剔除离群样本。...image-20191106200122936 6.获得Power值 rm(list = ls()) library(WGCNA) load(file = 'wgcna_input.Rdata') datExpr...是因为在wgcna中,认为模块是tom重叠性基因高的基因,所以需要计算基因和基因之间的tom重叠性,从而判断哪些基因应该属于同一个模块,哪些基因不在同一个模块。

2.1K32

WGCNA如何挖掘潜在的共表达基因

WGCNA中,对传统的相关系数进行乘方运算,用最终得到的值来表征基因间的相关性。在计算出这样的相关性统计量值之后,如何确定哪些基因是共表达的呢?...WGCNA的做法是聚类分析,聚类分析属于一种非监督的机器学习算法,通过聚类树,可以观察到哪些基因在聚类树中属于同一分支,属于同一分支的基因可以归为一类。...实际操作中,考虑到基因数目较多等情况,肯定需要算法来自动化的进行分类,WGCNA采用的是dynamicTreeCut这个R包。...在计算距离矩阵时,WGCNA采用了TOM这种统计量,该统计量可以表征网络中节点的相似性,计算公式如下 ?...上述的计算方法在WGCNA中都有对应的公式,代码如下 # 确定乘方运算中power的最佳取值 powers <- c(c(1:10), seq(from = 12, to=20, by=2))sft <

2K11

WGCNA:加权基因共表达网络分析

加权基因表达网络分析(Weighted gene co-expression network analysis, WGCNA),又叫权重基因共表达网络分析,其根本思想是根据基因表达模式的不同,挖掘出相似表达模式的基因...构建加权相关性基因网络软阈值的选择 WGCNA中对基因表达值之间的相关系数取n次幂,这是和普通聚类的最大不同,其直接结果是把基因间相关性的强弱的差异放大。...WGCNA提供几种相关性的算法,其中包括Pearson correlation(cor()函数)、Biweight mid-correlation(bicor()函数)、Spearman correlation...(cor(x, method=“spearman”)函数)本研究中采用WGCNA默认的Pearson相关,Pearson correlation计算快速,但对离群值敏感。...WGCNA给出了如何选择这个阈值的方法,其函数是pickSoftThreshold()。 2 加权共表达网络的构建和模块识别 一旦选择好了构建网络的β值,那么从网络构建到模块识别需要四个步骤。

3.3K53

WGCNA分析,简单全面的最新教程

WGCNA基本概念 加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集...理解WGCNA,需要先理解下面几个术语和它们在WGCNA中的定义。 共表达网络:定义为加权基因网络。点代表基因,边代表基因表达相关性。...WGCNA包实战 R包WGCNA是用于计算各种加权关联分析的功能集合,可用于网络构建,基因筛选,基因簇鉴定,拓扑特征计算,数据模拟和可视化等。...安装WGCNA WGCNA依赖的包比较多,bioconductor上的包需要自己安装,cran上依赖的包可以自动安装。通常在R中运行下面4条语句就可以完成WGCNA的安装。...", "stringr", "reshape2"), repos=site) WGCNA实战 实战采用的是官方提供的清理后的矩阵,原矩阵信息太多,容易给人误导,后台回复WGCNA 获取数据。

5.3K64

WGCNA得到模块之后如何筛选模块里面的hub基因

我在生信技能树多次写教程分享WGCNA的实战细节,见: 一文看懂WGCNA 分析(2019更新版) 通过WGCNA作者的测试数据来学习 重复一篇WGCNA分析的文章(代码版) 重复一篇WGCNA分析的文章...(解读版)(逆向收费读文献2019-19) 关键问题答疑:WGCNA的输入矩阵到底是什么格式 通常是介绍到,把输入的top5000 MAD的基因根据WGCNA算法划分为多个模块,然后不同模块都可以去和临床形状看相关性...other genes within the same module 3) and 4) kOut and kDiff mathematical derivatives from 1) and 2) WGCNA...module connectivity kWithin, kOut=kTotal-kWithin, and kDiff=kIn-kOut=2*kIN-kTotal 因为这个概念很少有人知道,所以大家使用WGCNA...把基因划分好模块之后,通常并不是计算这个指标,但是WGCNA官网推荐使用这个指标来挑选模块内部最重要的基因!

12.9K55

通过WGCNA作者的测试数据来学习

测试数据下载链接在:https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/SimulatedData.zip...在这样的测试数据里面很容易跟着作者的文档,一步步掌握WGCNA,文档步骤目录如下: Simulation of expression and trait data: PDF document, R script...在我https://github.com/jmzeng1314/my_WGCNA 展示的乳腺癌数据集,效果如下: ?...比如在我GitHub讲解的乳腺癌数据集是https://github.com/jmzeng1314/my_WGCNA 可以很清晰的看到不同乳腺癌压型有着不同相关性的基因模块。 ?...写在最后 WGCNA包的作者,精心设计的这个测试数据集,其实最重要的不是WGCNA流程,而是它背后所呈现的原理。 希望你能静下心来读一遍。

1.2K22

加权基因共表达网络分析(WGCNA)实例

image.png 接下来利用差异表达基因做加权基因共表达网络(WGCNAWGCNA分析用到的代码是我在腾讯课堂上购买的一门课程,课程内容是介绍WGCNA分析在植物上的应用的。...另外还有一大部分代码来自生信技能树公众号文章七步走纯R代码通过数据挖掘复现一篇实验文章(第七步WGCNA) #标准化基因表达矩阵,这一步是因为我之前尝试WGCNA分析的时候使用原始的counts会遇到报错...#提示输入数据不能为整数,我还不知道WGCNA应该用什么作为输入数据 expCPM<-cpm(rnaCounts, normalized.lib.sizes=TRUE) expCPM[1:3,1:3]...只选用差异表达基因做分析,我这么做事为了减小数据量,缩短运算时间 #我现在还不知道,只用差异表达基因与用完整的基因集有什么区别 expCPM<-expCPM[cg1,] dim(expCPM) library(WGCNA...image.png sft$powerEstimate setwd("WGCNA_example/") net = blockwiseModules( datExpr, power = sft$

2.3K21
领券