数值变量的分布类型
分布类型
对称分布 : 集中位置居中,左右两侧频数 基本对称的分布。常见正态分布。
偏态分布: 集中位置偏向一侧,频数分布不对称的分布。
正态分布
(一)正态分布曲线的特征
(二)正态分布曲线下面积分布规律
数值变量的统计描述
一、集中趋势指标描述
1.算术均数(均数mean) 适用于正态分布
总体均数:μ;样本均数:
2.几何均数(geometricmean)
常适用于一种特殊的偏态分布资料:对数正态分布资料
3.中位数(median,M)主要适用于偏态分布资料。中位数是指将一组变
量值从小到大排列,位次居中的变量值。
二、离散趋势指标描述
1.极差或者全距(range,R):R=最大值-最小值
计算简单,但是不能反映所有变量值的变异程度。
2.方差(Variance,VAR):是标准差的平方,表示一组变量值的平均离散程度。方差越大,离散程度越大。
3.标准差(StandardDeviation,SD):和均数的单位一致,表示一组变量值的平均离散程度。适合描述近似正态分布资料的离散趋势。
4.四分位数间距(Quartile,Q):主要用于偏态分布资料的离散趋势。Q=P75-P25
也可以直接用四分位数表达偏态分布资料的离散趋势,形式如下:(P25,P75)。
分类资料的统计描述
相对数(Relative Number)
1.比(Ratio)
又称为相对比。表示两个有关联的指标之比。
2.比例(Proportion)
事物内部各部分所占的比重(又称为构成比)。
3.率(Rate)
表示单位时间内某事件发生的频率。
分子为观察期间内某事件的发生例数。
分母为观察人-时(Person-Time)总数
SPSS应用:
数字型变量
分类变量统计描述