Python-拉丁方设计资料方差分析

本文860字3图,预计阅读需5分钟.

拉丁方设计(Latin Square design)是在随机区组设计基础之上发展而来的,用于研究3个及3个以上因素且每个因素水平数相同,各因素间无交互作用。

一般3个因素中,其中一个重要因素用字母称之为处理因素,另外两个因素需要加以控制,分别用行和列表示。

将实验因素的g个水平随机化排列成g行*g列的方阵,在该方阵的每行、每列,每个水平只出现一次。

拉丁方设计资料总变异分解为处理组变异、行区组变异、列区组变异和误差4部分。

数据来源

孙振球主编的第4版《医学统计学》例4-5,某研究者为了比较甲、乙、丙、丁、戊、已6种药物给家兔注射后产生的皮肤疱疹大小,采用拉丁方设计,选用6只家兔并在每只家兔的6个不同部进行注射位。

建立检验假设,确定检验水准

H0,1:μA=μB=μC=μD=μE=μF,即6种药物注射后家兔产生皮肤疱疹大小的总体均数相等。

H1,1:6种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等。

H0,2:μR1=μR2=μR3=μR4=μR5=μR6,即6只家兔皮肤疱疹大小的总体均数相等。

H1,2:6只家兔皮肤疱疹大小的总体均数不全相等。

H0,3:μC1=μC2=μC3=μC4=μC5=μC6,即6个注射部位皮肤疱疹大小的总体均数相等。

H1,3:6个注射部位皮肤疱疹大小的总体均数不全相等。

α=0.05

Python语言操作

在Python语言anova_lm(ols(formula,df).fit)中,formula有点R语言aov()函数味道,R中格式为y~a+b+c,Python语言中添加了大写字母C。

结论

F(药物)=3.906,P(药物)=0.012,按α=0.05检验水准,拒绝H0,1,接受H1,1,差异具有统计学意义,即6种药物注射后家兔产生皮肤疱疹大小的总体均数不全相等。

F(家兔)=1.466,P(家兔)=0.245,按α=0.05检验水准,不拒绝H0,2,差异无统计学意义,即尚不能认为6只家兔皮肤疱疹大小的总体均数不全相等。

F(注射部位)=0.500,P(注射部位)=0.772,按α=0.05检验水准,不拒绝H0,3,差异无统计学意义,即尚不能认为6个注射部位皮肤疱疹大小的总体均数不全相等。

本研究主要关注6种药物给家兔注射后产生的皮肤疱疹大小,根据上述结果,可认 为皮肤疱疹大小与药物有关。

代码:

import pandas as pd

from statsmodels.formula.api import ols

from statsmodels.stats.anova import anova_lm

df=pd.read_csv("C:\\Users\\lenovo\\Desktop\\lading.csv")

formula = "Values~C(yaowu)+C(jiatu)+C(buwei)"

anova_results = anova_lm(ols(formula,df).fit())

print(anova_results)

参考文献:

孙振球.医学统计学[M].第4版,北京:人民卫生出版社,2016.

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180421G1FY8W00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券