专栏首页张俊红抽样调查怎么做?

抽样调查怎么做?

全篇为5部分,主要采用5W2H的逻辑。

(本文框架)

01

输为什么要用抽样样本

我们经常需要调查某一批对象的某一项情况,如果所调查对象的体量比较少时,我们可以采取去量调查统计的形式,但是如果被调查统计对象体量较大时,很显然全量统计就有点不现实,我们需要采用抽取样本的形式。

02

如何设计抽样样本

1、确定目标总体,首先要明白目标总体何在,才知道样本取自哪里。这里的目标总体是指被调查对象的总体。

2、确定抽样单位,在确定目标总体以后,需要确定抽样单位,抽样单位就是该以什么样的量去抽取样本,比如检验某批食品的合格率时可以按每件也可以按每箱来抽取,这里的件和箱就是抽样单位。

3、确定抽样空间,最后需要确定一下抽样空间,即你在哪一范围内抽哪些对象呢。

03

样本设计不好出现的后果

我们有的时候会嫌上面的步奏过于繁琐,会通过拍脑袋的方式来进行抽样,但是这样的抽样往往是不准确的,会导致抽样样本发生偏倚。而偏倚样本无法代表目标总体,所以抽样结果无效。

04

出现不准确结果的原因

我们只知道抽样过程操作不当会导致样本数据进行偏倚,可是具体是是哪些操作导致样本结果偏倚的呢。

1、抽样空间中所选对象不全,因此未包含目标总体中的所有对象,。如果样本中的所选调查对象不全,那么就会导致结果偏倚。

2、抽样单位不准确,比如我们上面提到过的检验一批商品的合格率中抽样对象有件和箱两种,我们在选择抽样单位的时候一定要根据实际情况进行合理的选择。

3、调查问卷的问题设计不当。设计的问题要中性,要适合每个人回答。比如,某公司为了调查A品牌在消费者心中的喜欢程度,在做问卷的过程中,设置了“在XX行业,比起A品牌,你更喜欢哪个品牌?”这样的问卷,而这样的问卷明显带有偏倚,应该是“在XX行业,你比较喜欢哪个品牌”。

4、样本缺乏随机性。例如,如果在大街上展开调查,我们很可能会回避那些行色匆匆或气势汹汹的人,这样你就把这些人排除在调查范围以外。

05

如何避免不准确结果的出现

关于偏倚产生的原因,上面讲述了四点,虽然偏倚来源广泛,但是大部分可以归结为样本选取方法,我们接下来就该针样本选取方法进行改进。以下是集中样本选取方法。

1、简单随机抽样,简单随机抽样就是通过随机的选取一个大小为n的样本,所有大小为n的样本被选中的可能都相同。 简单随机抽样又包括重复抽样和不重复抽样,两者的主要区别是在一次抽选结束以后是否继续参与下一轮的抽选。

简单随机抽样具体的方式有:抽签,随机编号生成器。

除了简单随机抽样以外我们还有分层抽样、整群抽样、系统抽样三种。

2、分层抽样将总体划分为几个组或几个层,组或层中的单位都很相似,每一层都尽可能与其他层不一样,分号层以后,就对每一层进行简单随机抽样。

3、整群抽样将总体划分为几个群,其中每个群都尽量与其他群相似,可通过简单随机抽样随机抽取几个群,这个时候抽样单位为群。

4、系统抽样是选取一个数字K,然后没打第K个单位就抽样一次,用系统抽样的前提是总体之间无明显的位置(顺序)规律。

本篇完

本文分享自微信公众号 - 张俊红(zhangjunhong0428),作者:张俊红

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-11-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 你能分清多进程与多线程吗?

    在开始讲今天的正文之前,先给大家介绍一个概念「多线程工作」,这个概念可能有的人听过,也可能有的人平常工作中就是这么做的。我再来给大家讲讲这个概念,所谓的「多线程...

    张俊红
  • T检验的种类与区别

    我们前面讲过,T检验是用来比较两个均值之间是否有显著差异的一种检验方法。这一篇给大家介绍一下T检验的种类以及具体的Python实现代码。T检验是比较两个均值差异...

    张俊红
  • 讲讲Bootstrap是在干啥?

    学过统计学的同学应该对置信区间都有了解,置信区间又叫估计区间,是从概率来讲某个随机变量可能取的值的范围。

    张俊红
  • 统计学中抽样调查和一些常用的方法

    抽样调查的领域涉及如何用有效的方式得到样本。这些调查都利用了问卷,而问卷的设计则很有学问。它设计如何用词、问题的次序和问题的选择与组合等等。涉及包括心理学、社会...

    用户3003813
  • Laravel框架中缓存的使用方法分析

    本文实例讲述了Laravel框架中缓存的使用方法。分享给大家供大家参考,具体如下:

    砸漏
  • C语言求最小公倍数和最大公约数三种算法(经典)

    最小公倍数:数论中的一种概念,两个整数公有的倍数成为他们的公倍数,其中一个最小的公倍数是他们的最小公倍数,同样地,若干个整数公有的倍数中最小的正整数称为它们的最...

    Angel_Kitty
  • 如何为Tensorflow构建自定义数据集

    Tensorflow激发开发人员在几乎任何想到的领域中尝试他们令人兴奋的AI创意。ML社区中有三个众所周知的因素构成了一个好的深度神经网络模型做了一些神奇的事情...

    代码医生工作室
  • [UWP]通过自定义XamlCompositionBrushBase实现图片平铺

    我早就想试试自定义XamlCompositionBrushBase,但一直没机会。上一篇文章介绍到使用Win2D的BorderEffect实现图片的平铺功能,原...

    dino.c
  • python 字符串的split()函数详解

    split翻译为分裂。  split()就是将一个字符串分裂成多个字符串组成的列表。

    于小勇
  • C# 标准性能测试高级用法

    在 C# 标准性能测试 已经告诉大家如何使用 BenchmarkDotNet 测试性能,本文会告诉大家高级的用法。

    林德熙

扫码关注云+社区

领取腾讯云代金券