前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《大话脑成像》系列之十一:浅谈广义线性模型(--设计矩阵和对比矩阵)

《大话脑成像》系列之十一:浅谈广义线性模型(--设计矩阵和对比矩阵)

作者头像
用户1279583
发布2018-03-29 10:26:03
5K1
发布2018-03-29 10:26:03
举报
文章被收录于专栏:思影科技思影科技

咳咳,这篇短文继续讲统计。(老实说,下面的内容比较严肃与难懂,如果你觉得实在太晦涩,建议放弃吧,我们之间是不可能的)

学过统计的都知道,统计方法如单样本检验、双样本检验、方差分析都有公式直接计算。然而SPM,FSL等软件里的统计用的广义线性模型,而不是统计公式。因为在某些情况下,直接用统计公式行不通。比如想要在控制一个变量的条件下,比较两组数据的均值差异。这种情况下,直接使用双样本公式行不通,需要广义线性模型来求解。

广义线性模型公式: Y = AX。Y是因变量,X是自变量,A是设计矩阵。可以这么说,几乎所有的统计都可以用广义线性模型来描述。那么怎么理解广义线性模型呢?

理解广义线性模型关键是理解两个概念:设计矩阵和对比矩阵。

设计矩阵是一个n×m的矩阵,n表示的是观测值个数(比如被试个数),m表示自变量个数(每一列代表一个自变量)。如下图:这是一个5x4的设计矩阵,表示有5个观测值(5个被试),有4个自变量(比如第一列到第四列分别是:年龄、性别、教育年限、智商)

对比矩阵是一个p×m的矩阵(这里只讨论最简单的情形,1×m对比矩阵)。一个对比矩阵对应一个统计假设。比如说我们想关注,排除其他自变量的影响下,年龄和因变量(比如ALFF)的关系,那么对比矩阵就是[1 0 0 0],其中1表示我们关注的这个变量(年龄),0表示我们需要回归掉的变量。再比如对比矩阵 [0 1 0 0]表示排除年龄、教育年限和智商的情况下,看性别对因变量的作用。

下面我们从实际例子来理解设计矩阵和对比矩阵。

我们从最简单的单样本检验和双样本检验说起。这里有个假设,即是数据服从正态分布。

下面会有一些简单的公式和数学符号,当然也可以跳过这些公式,直接看图和说明也可。

(1)单样本检验

有一组服从均值为μ,方差为σ的正态分布数据,单样本检验是检验这一组数据均值是否等于0.即是检验μ是否为0.我们从广义线性模型角度出发来理解。首先画出正态分布图:

那么单样本检验的设计矩阵A就是一列1(在本例中是3x1的矩阵),这一列1代表了这一组数据的均值(我们可以把这个概念推广,如果设计矩阵里有一列全为1的,那么这一列代表的是所有数据总的均值)。如果我们要检验这组数据均值是否等于0,那么它的对比矩阵只有一个数,即1.

这时候如果我们想加入一个协变量-年龄。假设三个被试的年龄分别是29,31,28。那么就变为下面的格式:

这时候设计矩阵A是一个3x2的矩阵(请自行目测哪一个是设计矩A),3表示有3个观测值(3个被试),2表示有2两个自变量,分别是这一组数据的均值(μ)和年龄(age)。如果我们想看在回归年龄的情况下,检验这一组数据的均值是否为0,对比矩阵是[1 0]。如果想看年龄和这一组数据的关系,对比矩阵是[0 1]。好,那么对比矩阵[1 -1]表示的是什么呢?没有意义!!!所以对比矩阵一定要根据自己的假设来设置。

作业:请自行使用SPM做单样本统计检验,解释SPM出来的设计矩阵以及设置对应的对比矩阵。

这里省略误差项。右边前三个红色的值是第一组数据,后三个值是第二组数据。这里双样本t检验的设计矩阵是一个6x2的矩阵,6代表总共6个被试。2表示两个自变量(对应两列),第一列是第一组的均值(因为第一列前三个数值是1,后三个是0),第二列是第二组的均值(因为第二列前三个数值是0,后三个数值是1)。那么检验两组均值差异,对比矩阵是[1 -1]。那么[1 0]表示检验组一的均值是否为0,[0 1]表示检验组二均值是否为0。

如果我们想回归掉年龄,这时候设计矩阵就变为三列,前两列不变,第三列是年龄。

思考:如果把年龄变量加进来,检验年龄和组之间的交互,该设计矩阵是什么格式?

讲到这里,大家理解了设计矩阵和对比矩阵了吗?

下面列举其它几种统计方法的设计矩阵:

------------------

附注:

1. SPM中,可在Results一步查看设计矩阵并定义Contrast,也可以在Contrast manager中进行。

2. 单样本T检验中,[1 -1]没有意义:均值和年龄(协变量)所做比较无意义。

3. 加入年龄后,设计矩阵格式:

1

0

Age1

1

0

Age2

1

0

Age3

0

1

0

Age4

0

1

0

Age5

0

1

0

Age6

4. 2*2被试间方差分析,四列代表:组1被试在情况1下的均值,组1被试在情况2下的均值,组2被试在情况1下的均值,组2被试在情况2下的均值。

说了这么多,也不知道大家掌握没有,正如伟大的鲁迅先生曾经说过:“努力

学好数学,更好的进行脑影像的研究!”,希望大家还是多把数学学好,没准除了搞脑影像研究外,顺便拿个诺贝尔奖啥的(诺贝尔是没有数学奖的,知道为什么吗?据说是因为爱情)


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 思影科技 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档