对大量结果变量应用FDR校正 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

RNA-seq 详细教程：结果汇总与提取（11）

基因芯片数据分析（六）：DESeq2包的基本原理

DESeq2是另外一个分析差异基因的R包，它的功能很多，使用也比较复杂。我们在前面提到过，RPKM，FPKM与TPM是常用的用于均一化不同的样本reads数的方法，不过DESeq2和edgeR并不使用前面的三种方法，因为在对文库进行均一化时，存在两个问题，如下所示：

010

多分组差异分析解决方案（1）循环T检验

主要方法：将其中某一组设置为实验组，其余几组统一设置为对照组。第一步读取数据，合并表达矩阵和分组文件 #=========================================================================== #=========================================================================== rm(list = ls(all.names = TRUE)) options(st

评估细胞因子活性、免疫细胞极化和细胞间通讯的利器：IREA 分析（二）

之前简略介绍了一下IREA 分析评估细胞因子活性、免疫细胞极化和细胞间通讯的利器：IREA 分析，作者将IREA做成了可视化的网页，但是这个网页又不是那么丝滑，所以我在想，能不能根据作者提供的方法，通过R来实现更快捷的分析呢——

Molecular Psychiatry：三种主要精神疾病中的神经变异性

在主要的精神疾病（MPDs）中，人们怀疑存在大脑生理学的共同破坏。在这里，我们研究了休息时的神经变异性，这是一种成熟的脑功能行为相关标记，并探索了其在MPDs的基因表达和神经递质谱中的基础。我们招募了219名健康对照组和279名患有精神分裂症、重度抑郁症或双相情感障碍（躁狂症或抑郁状态）的患者。利用从静息态功能磁共振成像中获得的血氧合水平依赖性信号的标准差（SDBOLD）来表征神经变异性。通过偏最小二乘相关法来检验SDBOLD模式的经诊断中断及其与临床症状和认知功能的关系。在临床样本之外，我们估计了观察到的SDBOLD破坏模式与死后基因表达、元分析认知功能和神经递质受体谱之间的空间相关性。发现了两种SDBOLD中断的转诊断模式。模式1在所有诊断组中都表现出来，在精神分裂症中最为明显，其特征是语言/听觉网络的SDBOLD较高，而默认模式/感觉运动网络的SDBOLD较低。相比之下，模式2仅表现在单极和双相抑郁症中，其特征是默认模式/显著性网络中SDBOLD较高，而感觉运动网络中SDBOLD较低。模式1的表达与MPDs的临床症状和认知缺陷的严重程度相关。这两种被破坏的模式与基因表达（如神经元投射/细胞过程）、元分析认知功能（如语言/记忆）和神经递质受体表达谱（如D2/5-羟色胺/阿片类受体）具有不同的空间相关性。总之，综上所述，神经变异是MPDs潜在的经诊断生物标志物，其大量空间分布可以通过基因表达和神经递质受体谱来解释。MPDs的病理生理学可以通过测量休息时的神经变异来追踪，异常变异的不同空间模式产生不同的临床认知特征。

社会关系强度调节群体成员脑-脑表征相似性

在我们的社会中，人类形成了合作群体，每个群体成员之间的关系质量各不相同。在与他人建立关系时，我们使用对群体成员和整个群体的态度和信念来与我们社会网络中的特定成员建立关系。然而，我们还不知道大脑对群体成员的反应是如何促进个体之间关系质量的。我们在这里使用一个循环的人际感知范式来解决这个问题，在这个范式中，每个参与者既是他们组中每一个其他成员的感知者，也是目标，在20个独特的组中，每个组中有5到6个成员(总共N = 111)。利用功能性磁共振成像，我们表明社会关系强度的测量调节了成对的参与者在社会认知中涉及的大脑区域感知他们群体中的其他成员时的反应之间的脑对脑多体素相似模式。这些结果为社会认知过程服务于群体成员间人际关系强度的脑机制提供了证据。

思影科技啮齿类动物（大小鼠）神经影像数据处理业务

思影啮齿类动物（大鼠/小鼠）数据处理现主要涵盖sMRI（T1加权像）、dMRI（DWI，弥散加权成像）和fMRI（功能磁共振）三种模态。

思影数据处理业务一：功能磁共振（fMRI）数据处理

1. 数据预处理功能磁共振数据预处理流程包括数据格式转换、去除不稳定时间点、时间层校正、头动校正、空间标准化、空间平滑、去线形漂移、滤波、回归协变量、去除头动过大的时间点等。

挖掘数据内部联系：相关性分析

皮尔森相关系数也叫皮尔森积差相关系数，用来反映两个变量之间相似程度的统计量。或者说用来表示两个向量的相似度。

JAMA Psychiatry脑电研究：抗抑郁药与安慰剂治疗的皮质连通性调节因子在重度抑郁症中的作用

研究重点：尽管功能性磁共振成像发现表明，皮质连通性网络在抑郁症治疗选择中发挥作用，但其临床应用仍然有限。近来，方法学研究进展揭示，类似于使用EEG的连通性网络，是一种更容易在临床实践中实现的工具。

多分组差异分析解决方案（2）分批次差异基因后取交集

主要方法：如果不同分组代表着一定的趋势，例如group1，group2，group3的样本严重程度越来越重。那么就可以求group1和group2的差异基因，group2和group3的差异基因，group1和group3的差异基因，最后把三次得到的上调差异基因和下调差异基因求交集。

AJP：大脑功能连接的内在模式在调节重度抑郁患者抗抑郁治疗反应中的作用

重度抑郁症是一种精神科慢性疾病，最常见的治疗方法是使用单胺类抗抑郁药。临床发现药物治疗的预后因人而异，一些病人的症状在服用抗抑郁药后得到了极大改善而其他人则反应平平甚至没有作用。然而，目前我们对于调控抗抑郁药疗效的神经影像学机制知之甚少。因此来自四个临床中心（德克萨斯大学西南医学中心、麻省总医院、哥伦比亚大学和密歇根大学）的研究者们通过一项多中心纵向随机双盲安慰剂对照试验（EMBARC），采用基于感兴趣区域的方法，按照意向性分析原则利用线性混合效应模型来确定大脑各区域之间的静息态连接模式是否能预测抗抑郁药物(舍曲林)与安慰剂的疗效差异。该研究由德克萨斯大学西南医学中心精神科的Cherise R. Chin Fatt等人发表在The American Journal of Psychiatry期刊上，具体内容如下：

与内在功能连接个体变异性相关的基因表达

研究表明，内在功能连接（FC）中的个体间变异性（ISV）与各种各样的认知和行为表现相关。然而，ISV在FC中的潜在组织原理及其相关基因转录谱尚不清楚。使用静息态功能磁共振成像数据从人类连接组计划（299年成人被试）和艾伦人类脑图谱的微阵列基因表达数据，我们进行了转录-神经成像关联研究调查内在的ISV的空间配置及其与空间基因转录谱的关联。我们发现，FC中多模态关联皮层的ISV最大，而单模态皮层和皮层下区域的ISV最小。重要的是，偏最小二乘回归分析显示，与人类加速区（HARs）相关的基因的转录谱可以解释FC中ISV空间分布的31.29%的变异。转录谱中的顶级相关基因在中枢神经系统的发育、神经发生和突触的细胞成分中得到了丰富。此外，我们还观察到，基因转录谱对FC中ISV的异质性分布的影响是由脑血流结构介导的。这些发现强调了ISV在FC中的空间排列，以及它们与转录谱和脑血流供应变化的耦合。

人类小脑内在组织背后的基因图谱

人类小脑的功能多样性在很大程度上被认为更多地来自于其广泛的联系，而不是局限于其部分不变的结构。然而，小脑内在组织中连接的确定是否以及如何与微尺度基因表达相互作用仍不清楚。在这里，我们通过研究同时连接小脑功能异质性及其驱动因素的遗传基质，即连接因素，来解码小脑功能组织的遗传图谱。我们不仅鉴定了443个网络特异性基因，而且还发现它们的共表达模式与小脑内功能连接（FC）密切相关。其中90个基因也与皮质-小脑认知-边缘网络的FC有关。进一步发现这些基因的生物学功能，我们进行了“虚拟基因敲除”，通过观察基因之间的耦合和FC以及将基因分成两个子集，即，一个涉及小脑神经发育的阳性基因贡献指标（GCI+）和一个与神经传递有关的阴性基因集（GCI−）。一个更有趣的发现是，GCI−与小脑连接-行为关联显著相关，并与许多公认的与小脑功能异常密切相关的脑部疾病密切相关。我们的研究结果可以共同帮助重新思考小脑功能组织背后的遗传底物，并为神经精神疾病中涉及小脑的高阶功能和功能障碍提供可能的微宏观相互作用的机制解释。

pheatmap带你轻松绘制聚类相关性热图

购买后微信发小编订单截图即邀请进新的会员交流群，小编的文档为按年售卖，只包含当年度的除系列课程外的文档，有需要往年文档的朋友也可下单购买，需要了解更多信息的朋友欢迎交流咨询。

多种差异分析方法识别微生物标记物

识别组间差异物种是微生物领域常见的数据分析。我们采用三类不同的差异分析方法来发现显著差异的微生物物种，它们分别是：

文献翻译Complex integrated analysis of lncRNAs-miRNAs-mRNAs in oral squamous cell carcinoma(2)材料和方法

（HNSCC）从Cancer Genome Atlas下载（TCGA）数据库（https://gdc-portal.nci.nih.gov/）。根据口腔的解剖学定义，387个口腔样本（336个OSCC样品和51个正常对照样品）从587个HNSCC数据中提取。 mRNA和miRNA表达数据包括327个OSCC样本和31个非癌样本已下载。原始lncRNAs和mRNAs 数据（HUGO基因命名委员会（HGNC）数据库（http://www.genenames.org/）包含2775个lncRNA和19004他们的靶mRNA。

使用 ALDEx2 进行差异分析

1.用原始输入数据生成每个分类单元的后验概率分布；然后将该分布进行中心对数变换。2.将变换后的值，用参数或非参数检验进行单变量统计检验，并返回 p 值和 Benjamini-Hochberg 校正后的 p 值。

如何判断多个检验属于多重比较，从而需要p值校正？

数学上的假设检验从根本上来说是基于哲学上的反证法，目的是为了确定差异。我们说一个检验对应一个零假设，p值实际上是零假设发生的概率，p值过低则拒绝零假设；1-p则是备择假设发生的概率。也就是说，当我们在假设检验中去计算p值，我们实际上想知道的是备择假设（一般也是我们想要的结果）的发生概率。因此判断多重比较的关键在于梳理清你所做的假设体系。

思影科技功能磁共振(fMRI)数据处理业务

随着技术的进步，功能磁共振成像（fMRI）已成为脑疾病、认知神经科学等领域的重要研究手段。思影科技紧随潮流，推出了一系列fMRI数据处理培训课程，广受相关领域研究者们的好评。在解决研究者们学习需求的同时，科研合作也变得日趋重要。为此，思影科技推出fMRI数据处理服务，以更好地协助解决大家面临的科研问题，如感兴趣请联系杨晓飞siyingyxf或19962074063（微信号）进行咨询，电话：18580429226

识别差异微生物的方法汇总

现在 Nearing, Douglas et al. Nature Comm. Microbiome differential abundance methods produce different results across 38 datasets.文章对常用的差异分析方法做了基准测试，本文将不同方法的核心代码记录下来。

pheatmap带你轻松绘制聚类相关性热图

OSCA单细胞数据分析笔记12—Intergrating Datasets

无论是scRNA-seq，还是Bulk RNA-seq，批次效应都是一个很头疼的问题，如何有效地校正、并且正确地使用校正后的数据是很值得讨论的分析点。

富集分析：GSEA 分析介绍

之前的一些推文，大部分收录专题于生物信息学，目的是帮助大家入门生物信息学的领域。本次开设新专题，“富集分析”，了解富集分析的各种手段，学会十八般武艺。

从时间变异性角度看睡眠剥夺后的异常动态功能连接

睡眠剥夺(SD)在现代社会非常普遍，被认为是几种临床疾病的潜在因果机制。先前的神经影像学研究已经利用磁共振成像(MRI)从静态(比较两个MRI会话[一个在SD后和一个在休息清醒后])和动态(在SD的一个晚上重复MRI)的角度探索了SD的神经机制。最近的研究主要集中在静息状态扫描时的动态脑功能组织。本研究采用一种已成功应用于许多临床疾病的新指标(时间变异性)来检测55名正常青年受试者SD后的动态功能连接。我们发现，睡眠不足的受试者在大范围的大脑区域表现出区域水平的时间变异性增加，而在几个丘脑亚区域表现出区域水平的时间变异性减少。SD后，参与者在默认模式网络(DMN)中表现出更强的网络内时间变异性，在许多子网对中表现出更强的网络间时间变异性。通过逐步回归分析发现，视觉网络和DMN之间的网络间时间变异性与精神运动者警觉测验最慢的10%反应速度呈负相关。综上所述，我们的研究结果表明，睡眠不足的受试者表现出异常的脑功能动态结构，这为研究睡眠不足的神经基础提供了新的见解，有助于我们理解临床障碍的病理生理机制。

什么，你算出的P-value看上去像齐天大圣变的庙？

前几天，Nature上一篇comment再度引发关于p-value如何使用和解释的文章：Scientists rise up against statistical significance，800多名科学家联合声明拒绝使用基于p-value或置信区间或贝叶斯因子等的二分法将研究结果分为统计显著和统计不显著两个部分，而是应该把置信区间改为兼容性区间, 描述区间所有值的实际含义，尤其是其所代表的的效果 (point estimate)或极值在哪。给定了统计假设，任何极值内的值与研究数据都是兼容的。基于此，作者可以更好的强调数据分析带来的期望值和不确定性，不再对结果过于自信或悲观。

R语言之基因表达可视化实现

基因表达的差异性分析是生物信息学中的必经之路。那么，基因表达差异的可视化展示也就具有了很重要的地位。首先我们介绍下目前在基因表达差异性可视化中的集中展示形式：

Lancet Neurology：最低意识障碍脱离患者的意识的神经关联的多模态影像学研究

意识障碍是指人对周围环境以及自身状态的识别和觉察能力出现障碍。一般分为两种，一种以兴奋性降低为特点，表现为嗜睡/意识模糊/昏睡直至昏迷；另一种是以兴奋性增高为特点，表现为高级中枢急性活动失调的状态，包括意识模糊/定向力丧失/感觉错乱/躁动不安/言语杂乱等。意识障碍中特殊的障碍群体包括：无反应觉醒综合征和最低意识状态，无反应觉醒综合症是我们常说的“植物人”，最低意识状态是一种严重的意识障碍，但与“植物”状态不同的是，这种障碍人群存在最小但仍旧较为清晰的认识自我和周围环境的能力。

单变量和多变量对基因表达式的预测能力对比

在这篇文章中，我们将比较LASSO、PLS、Random Forest等多变量模型与单变量模型的预测能力，如著名的差异基因表达工具DESeq2以及传统的Mann-Whitney U检验和Spearman相关。使用骨骼肌RNAseq基因表达数据集，我们将展示使用多变量模型构建的预测得分，以优于单变量特征选择模型。

R语言中的共定位分析

基于上面的假设，第四种设想 H4 在统计学上概率越高，越能解释显著信号位点如何影响表型。，H4值的范围在0-1之间，0表示概率为0%，1表示概率为100%。后验概率越高越好。很多文献认为PPA > 0.95的位点是共定位位点，也有一些文献会放松要求到0.75。接下来我们看下在R中如何进行实现这个分析方法。首先是包的安装：

用 FastQTL 进行 cis-eQTL 分析

上周给大家介绍了 Matrix eQTL 的用法，它利用高效的矩阵运算实现了在很短的时间内完成关联分析。在 eqtl 分析中，我们对每个基因都进行了大量检验，所以我们必须进行多重检验校正。最简单的方案就是用 Bonferroni 法校正 P 值。然而由于不同基因组区域的特异性以及不同位点的等位基因频率和 LD，Bonferroni 方法通常都会过于严格，导致许多假阴性。为了解决这个问题，一般的我们可以分析每种表型的数千个置换数据集，以得到这些关联的零分布。接着就可以得到这些观察值来自零分布的可能性，从而得到一个调整后的 P 值。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐