自然界中,许多连续型随机变量都呈现钟形分布,又叫正态分布。
只要出现钟形分布图形,即判定数据呈常态分布。
只要图形呈直线,即判定数据呈常态分布。
小样本使用了Shapiro-Wilk检定。 大样本使用ks检定。
假设是:数据服从正态分布。 当p<0.05,拒绝假设,即数据不服从正态分布。
#generate two data sets
#first normal, second from a t-distribution, third form a uniform-distribution
words1 = rnorm(100); words2 = rt(100,df=3);words3=runif(100)
#have a look at densities
plot(density(words1))
plot(density(words2))
plot(density(words3))
#perform the test
#hypothesis: normal distribution, it's rejected when p<0.05
shapiro.test(words1)
shapiro.test(words2)
shapiro.test(words3)
ks.test(x,"norm")
#plot using a qqplot
qqnorm(words1);qqline(words1,col=2)
qqnorm(words2);qqline(words2,col=2)
qqnorm(words3);qqline(words3,col=3)