excel数据分析库系列|抽样设计

今天开始跟大家分享excel数据分析库系列——抽样设计

作为微软excel中一直以来隐藏的最深最上档次的功能组件,excel数据分析工具库需要用户手动调用并开启(还未开启的请参考小魔方历史文章),工具库里内置了常用的统计模块和计量回归的工具!

但是毕竟不是专业的统计分析工具,内置的工具模块也都只是涵盖了最基本的统计过程和回归方法,设计到稍微深层次的检验与诊断修正过程,excel便无能为力!

但是我想,如果要用来完成毕业论文或者科研项目,大家绝对不会单纯依靠excel来做分析,如果是仅仅辅助工具,那么excel分析工具库在很多时候可以让我们免于哪些大型数据分析软件给我们带来的功能困扰和内存挑战!

因而熟悉一下他的核心统计模块还是很有必要的,起码简单点的统计回归还是可以胜任的。

今天讲解他的抽样调查功能

首先输入你要抽样的总体范围:

然后打开数据——分析——数据分析——抽样

再输入区域中填入要抽样的总体数据范围,抽样方法默认是随机(一会介绍周期),样本数根据需要设置,在输出选项中根据需要设置(输出区域会将抽样结果输出到当前工作表某一单元格区域(自定义);新工作表组将自动将结果输出到新建工作表;新工作薄选项将会自动输出到新建工作薄的sheet1工作表中)。

确定之后你就可以看到抽样的样本结果:

下面介绍周期抽样:

周期抽样给出的备选菜单与随机抽样略有不同,没给出抽样个数而是给出了间隔,我们暂且输入15,然后确定,可以看到周期抽样结果。

由于我们的数据集并非排列在一列,而是多列排列,所以随机抽样与周期抽样的特征看的并不明显,下面我们用一列排序后的连续数据再验证一次两者之间的差别:

数据1~100,两个抽样结果如下:

你可以观察到,随机抽样的话,你是看不到任何规律的,而周期抽样(间隔5),软件输出的样本是以5为间隔的有序数据列表,而且随机抽样需要我们设定抽样个数,而间隔抽样需要我们设定间隔(个数不确定,由间隔而定,间隔越大个数越少,反之越多)。

原文发布于微信公众号 - 数据小魔方(datamofang)

原文发表时间:2016-05-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CreateAMind

强化学习基础概念ppt视频讲解

13730
来自专栏MelonTeam专栏

老司机用神经网络带您安全驾驶

0 概述 随着今年深度学习的热潮的来临,神经网络已经被应用在越来越多的应用中。而在印象中对于神经网络进行训练的往往需要借助大量的计算资源与数据。其实通过一定的...

26650
来自专栏应兆康的专栏

开发集和测试集

20810
来自专栏机器之心

资源 | 谷歌全attention机器翻译模型Transformer的TensorFlow实现

选自GitHub 机器之心编译 参与:黄小天、Smith 谷歌前不久在 arXiv 上发表论文《Attention Is All You Need》,提出一种完...

542110
来自专栏AI研习社

MXNet 宣布支持 Keras 2,可更加方便快捷地实现 CNN 及 RNN 分布式训练

AI 研习社按,近期,AWS 表示 MXNet 支持 Keras 2,开发者可以使用 Keras-MXNet 更加方便快捷地实现 CNN 及 RNN 分布式训练...

13770
来自专栏AI科技大本营的专栏

如何通过深度学习轻松实现自动化监控?

【导读】这是一篇关于使用基于深度学习的目标检测来实现监控系统的快速教程。在教程中通过使用 GPU 多处理器来比较不同目标检测模型在行人检测上的性能。

11750
来自专栏AI研习社

IBM高级研发工程师武维:如何分布式训练深度学习模型?| 分享总结

AI 研习社按:随着深度学习神经网络规模越来越大,训练一个深度神经网络(Deep Neural Networks, DNNs)往往需要几天甚至几周的时间。为了加...

29450
来自专栏企鹅号快讯

如何用Python和深度神经网络识别图像?

视觉 进化的作用,让人类对图像的处理非常高效。 这里,我给你展示一张照片。 如果我这样问你: 你能否分辨出图片中哪个是猫,哪个是狗? 你可能立即会觉得自己遭受到...

47890
来自专栏人工智能

TensorFlow图像分类教程

云栖君导读:深度学习算法与计算机硬件性能的发展,使研究人员和企业在图像识别、语音识别、推荐引擎和机器翻译等领域取得了巨大的进步。六年前,视觉模式识别领域取得了第...

37460
来自专栏人工智能头条

资源 | 深度学习图像标注工具汇总

19510

扫码关注云+社区

领取腾讯云代金券