前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【MATLAB 从零到进阶】day11 描述性统计

【MATLAB 从零到进阶】day11 描述性统计

作者头像
统计学家
发布2019-04-10 10:58:55
1.4K0
发布2019-04-10 10:58:55
举报

描述性统计量

均值mean 方差var和标准差std 最值max/min 极差range 中位数median 分位数quantile/prctile 众数mode 变异系数std/mean k阶原点矩 mean(score.^2) k阶中心距moment(score,k) 偏度skewness 峰度kurtosis

cdfplot和ecdf函数函数

调用方式: cdfplot(X) [f,x] = ecdf(y)

功能:绘制经验分布函数图

>> score=xlsread('examp9_1_1.xls','Sheet1','G2:G52'); >> score=score(score>0); >> figure; >> [h,stats]=cdfplot(score) h = 152.0016 stats = min: 49 max: 98 mean: 79 median: 80 std: 10.1489 >> set(h,'color','k','LineWidth',2); >> x=40:0.5:100; >> y=normcdf(x,stats.mean,stats.std); >> hold on >> plot(x,y,':k','LineWidth',2); >> legend('经验分布函数','理论正态分布','Location','NorthWest');

hist、ecdf和ecdfhist函数函数

功能:hist函数,用来绘制频数直方图

ecdf和ecdfhist函数,用来绘制频率直方图

调用方式:

% 频数直方图

hist(Y,nbins)

% 频率直方图

[f,x] = ecdf(y)

ecdfhist(f,x)

>> score=xlsread('examp9_1_1.xls','Sheet1','G2:G52'); >> figure; >> [f,xc]=ecdf(score); >> ecdfhist(f,xc,7); >> xlabel('考试成绩'); >> ylabel('f(x)'); >> x=40:0.5:100; >> y=normpdf(x,mean(score),std(score)); >> hold on >> plot(x,y,'k','LineWidth',2) >> legend('频率直方图','正态分布密度曲线','Location','NorthWest');

boxplot函数

功能:用来绘制箱线图

调用方式:

boxplot(X)

>> figure; >> boxlabel={'考试成绩箱线图'}; >> boxplot(score,boxlabel,'notch','on','orientation','horizontal') >> xlabel('考试成绩');

正态概率图

正态概率图用于正态分布的检验,实际上就是纵坐标经过变换后的正态分布的分布函数图,正常情况下,正态分布的分布函数曲线是一条S形曲线,而在正态概率图上描绘的则是一条直线。如果采用手工绘制正态概率图的话,可以在正态概率纸上描绘,正态概率纸上有根据正态分布构造的坐标系,其横坐标是均匀的,纵坐标是不均匀的,以保证正态分布的分布函数图形是一条直线。

normplot函数

调用方式: h = normplot(X)

功能:用来绘制正态概率图

>> figure; >> normplot(score)

p-p图

p-p图用来检验样本观测数据是否服从指定的分布,是样本经验分布函数与指定分布的分布函数的关系曲线图。通常情况下,一个坐标轴表示样本经验分布,另一个坐标轴表示指定分布的分布函数。每一个样本观测数据对应图上的一个“+”号,图中有一条参考直线,若图中的“+”号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参考线的“+”号越多,说明样本观测数据越不服从指定分布。

probplot函数

功能:用来绘制p-p 图

调用方式: h = probplot(distribution,Y)

%% 对数正态概率图

>>figure; >>probplot('lognormal',score);

q-q图

q-q图也可用来检验样本观测数据是否服从指定的分布,是样本分位数与指定分布的分位数的关系曲线图。通常情况下,一个坐标轴表示样本分位数,另一个坐标轴表示指定分布的分位数。每一个样本观测数据对应图上的一个“+”号,图中有一条参考直线,若图中的“+”号都集中在这条参考线附近,说明样本观测数据近似服从指定分布,偏离参考线的“+”号越多,说明样本观测数据越不服从指定分布。

qqplot函数

功能:用来绘制q-q 图

调用方式: h = qqplot(X,Y)

>> banji = xlsread('examp9_1_1.xls','Sheet1','B2:B52'); >>score = xlsread('examp9_1_1.xls','Sheet1','G2:G52'); >>banji = banji(score > 0); >>score = score(score > 0); >>score1 = score(banji == 60101); >>score2 = score(banji == 60102); >>qqplot(score1,score2)

频数和频率分布表

调用tabulate函数作频数和频率分布表

tabulate函数

功能:用来作频数和频率分布表

调用方式: TABLE = tabulate(x)

【例】统计数值型数组中各元素出现的频数、频率。

>>x = [2 2 6 5 2 3 2 4 3 4 3 4 4 4 4 2 2 6 0 4 7 2 5 8 3 1 3 2 5 3 6 2 3 5 4 3 1 4 2 2 2 3 1 5 2 6 3 4 1 2 5]; >>tabulate(x(:)) Value Count Percent 0 1 1.96% 1 4 7.84% 2 14 27.45% 3 10 19.61% 4 10 19.61% 5 6 11.76% 6 4 7.84% 7 1 1.96% 8 1 1.96%

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-07-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档