相关和回归—初步了解

本文2313字〡10图〡预计阅读14分钟

10月份进入相关和回归模块的学习,医学统计基础知识学习包括四个模块:

基础:统计描述、概率分布、参数估计

4种假设检验:t检验、F检验、卡方检验和非参数检验

相关与回归:分类变量关联分析、简单线性相关和回归、多重线性回归与相关、Logistic回归、Cox比例风险模型

统计设计与分析:干预性和观察性研究设计、样本量估算、生存分析

本文目录

SPSS软件相关、回归分析模块

相关和回归分析思维导图

简单线性相关和回归简介

分类变量的关联性分析简介

1

SPSS软件相关、回归模块

SPSS相关:双变量(Pearson和Spearman)、偏相关、距离和典型相关

SPSS分类变量相关:交叉表中的名义和有序变量相关分析

SPSS回归:线性、Logistic、Probit、非线性

SPSS回归:Cox回归、含有依存变量Cox回归

2

相关和回归分析思维导图

下面为常用相关和回归分析思维导图,根据研究目的、资料类型和特征还可以细分,仅供参考(个人经验整理)。

常见相关分析思维导图

常见回归分析思维导图

多元线性回归和多重线性回归?

很多同学明明要做多重线性回归,硬是说要做多元线性回归,多重线性回归的英译为“Multiple linear regerssion”,多元线性回归的英译为“Multivariate linear regression”

"元"一般针对因变量数量来说,最简单的区别看是否存在多个因变量。

Logistic回归和多重线性回归使用指征?

因变量为定量资料,考虑多重线性回归,也可将因变量转换为定性(分类)资料来采用Logistic回归

因变量为二分类(如死亡和痊愈、复发和未复发、患病和未患病、阳性和阴性等)或多分类(如无效、好转、显效、治愈),同时不涉及时间维度,考虑Logistic 回归模型。

Logistic回归模型分类?

Logistic回归模型依据因变量分类的数量可分为:二分类(二元、二项)Logistic回归、多分类(多元、多项)Logistic回归

多分类依据是否有序又分为:有序多分类(多元、多项)Logistic回归、无序多分类(多元、多项)Logistic回归。

依据设计不同(如配对设计)可分为非条件Logistic回归和条件Logistic回归

Logistic回归和Cox比例风险模型使用指征?

Logistic回归模型只考虑终点事件出现与否,多于用横断面、现况和回顾性资料的研究

Cox模型不仅考虑终点事件出现与否,还考虑到达终点所经历的时间,常用在肿瘤、手术操作等随访、预后研究(如前瞻性队列研究)

3

简单线性相关和回归

简单线性相关指两个随机变量之间的线性趋势关系,常见Pearson积矩相关、Spearman秩相关;简单线性回归为两个连续型变量间的线性依存变化分析。

简单线性相关重在研究两个变量间的共线趋势,关注两个变量间线性关系的方向和强度;

简单线性回归分析重在分析两个变量之间的依存关系,即研究一个变量如何随另一个变量变化。

《BMJ》杂志上有四篇文章,分别为《Pearson's correlation coefficient》、《Spearman's rank correlation coefficient》、《Simple linear regression》和《Corelation versus linear regression》,四篇文献深入浅出讲解了Pearson积矩相关、Spearman秩相关、简单线性回归以及相关、回归的区别,非常好的学习材料,可根据下图文献信息检索。

来源于BMJ杂志官网检索

4

分类变量的关联性分析

两个定量变量之间、单个定量变量与单个等级变量之间的关联性分析可用Pearson积矩相关、Spearman秩相关或Kendall相关,如果遇到至少有一个变量为无序分类变量时,关联性分析通常进行列联表独立属性的卡方检验,如果遇到两个变量均为有序变量可计算Gamma系数。

这里交叉表分类资料独立性检验和两独立样本频率分布的卡方假设检验的公式(以及理论频数、自由度)相同,但研究目的、设计方案、数据结构和检验结果解释都不尽相同。

两个变量均为有序变量时可计算Gamma系数,如果采用Spearman秩相关检验会产生大量秩次相等的平均秩次,从而低估变量间的关联系数;由于R×C列联表资料卡方检验与分类变量顺序无关,等级效应无法表达,也不能用卡方检验。

分类变量关联度分析公式和思维导图如下:

2×2分类资料

独立性检验采用卡方检验,关联度计算可采用ф系数、CramerV系数、Pearson列联系数

2×2配对资料

独立性检验采用McNemar检验,关联度计算可采用ф系数(只用于四格表资料)

无序R×C分类资料

独立性检验采用卡方检验,关联度计算可采用CramerV系数、Pearson列联系数

两有序R×C分类资料

独立检验采用Z检验,关联度查看Gamma系数

参考文献:

1.方积乾.卫生统计学[M].第七版,北京:人民卫生出版社,2013.

2.Correlation vs linear regression[J].Bmj,2013,346(17):f2686.

3.Simple linear regression.BMJ 2013;346:f2340[J].Bmj Clinical Research, 2013.

4.Spearman's rank correlation coefficient[J].Bmj,2014,349(nov28 1):g7327.

5.Pearson's correlation coefficient[J].Bmj,2012,345:e4483.

—END—

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181011G0F41900?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券