前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 珍藏函数实现随机/分层/系统抽样

python 珍藏函数实现随机/分层/系统抽样

作者头像
萝 卜
发布2022-05-12 19:45:06
8610
发布2022-05-12 19:45:06
举报
文章被收录于专栏:Python 商业数据分析案例

前言

抽样调查在统计学与 Python数据分析/数据挖掘/数据科学 中非常常用,在实际业务中更是高频刚需,而 Python 并没有专有的抽样方法库,所以笔者将自己以前的笔记汇总到自写库中,用到时直接调用函数即可,快速且精确。

进行统计学分析,假设检验,方差分析,单因素xx,t 检验,xx 检验的时候,样本量数据如果过大,计算出来的统计检验力如 p 值等就不可信。即假如我们的整体数据有 10 万,进行假设检验的时候只需要根据数据分布情况分层抽样一小部分就行了,所以分层抽样用得也是最多的,但很可惜 Python 并没有这样的库,只能自己写,一个品性优良的抽样方法库将使分析效率大大提高。

需求

  • 简单的随机抽样
  • 分层抽样:根据某个名义变量进行分层抽样,如根据性别来抽取男女各100人
  • 系统抽样:等距离抽样

本文将专注于实现前两个非常常用的抽样方法

效果实现

这里以一份电商数据为例进行演示

数据预览(只显示前五行)

随机抽样的两种方法

分层抽样

按照个数抽:每层抽 n 个

按比例抽,每层抽 n%

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据分析与商业实践 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档