专栏首页SAS程序分享号号号SAS-如何随心所欲的抽取样本

SAS-如何随心所欲的抽取样本

前情说明

我们在处理大样本的时候,往往会遇到随机抽样的需求,在SAS中抽样的方法有一个专门的Proc过程步(Proc surveyselect),这个过程步可以简单快速的实现一些随机抽样,有时候我们的随机抽样并不是那么呆版的抽样,这个时候proc surveyselect可能就不那么好用了,比如我们要质检一批数据,每个数据集观测都不一样,需要从每个数据集中随机抽取100条记录,如果不足100条则全部抽取出来...这个如何用proc surveyselect实现呢?反正小编是不会!当然仅仅是这,其实小编还是可以用proc surveyselect过程步做出来的,只是在抽样前获取数据集观测数,进行判断...如果小于指定观测,直接输出结果,如果大于则用抽样过程步进行简单的抽样!

那么如果抽样在稍微复杂一点,数据还要按照某个变量分组抽样,优先抽取某一类,如果这一类的样本不足抽取的数量,则在剩下的样本池中随机抽取!这个时候可能proc surveyselect更加无能为力了(也很有可能是小编见识不够)!当然还有更加复杂的抽样,按照各种分布抽样啥的!该如何去实现呢?

随机函数

看到这个标题!我聪明的粉丝朋友们,想必都已经知道了是什么方法去实现灵活复杂的随机抽样了!是的,这里需要介绍一下随机函数,利用随机函数给数据集的每一条观测一个随机数,然后根据随机数排序,取排序后的前100条观测...还是借用网络上的一张图,至于图中是否正确,这个留给诸位考证,小编是只用过ranuni函数给每条观测一个随机数,然后进行抽样!

小编认为方法比代码重要,这次就只分享方法了,具体代码其实都是很简单,都是一些基础的语句,有了方法,需求就很好实现。还是插一张图片~具体干嘛的,小编就不说了

...很早以前小编做的一个抽样的需求的...

凑字数?

内容真的很少!!!那么小编还是来凑一下字数,纠正一个错误!很久以前小编见识不够,认为SAS不能压缩ZIP,还特意去用Python实现一下,同样也是在很久以前,小编知道了SAS ODS也是可以把文件加压成ZIP文件的。所以就在这个隐蔽的角落承认一下错误

。还是来看一张图!

今天就这么多了,后续内容,敬请期待~

本文分享自微信公众号 - SAS程序分享号号号(xiaocgn),作者:Setup~

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • SAS-Macro编写调试技巧及相关(Option)

    在说正文前,小编还是要插播一下小编今年的一次面试经历。今年,小编去5家公司面试了,恩,从5月份开始,差不多一个月去一家公司面试,前俩家被拒,后三家都拿到offe...

    Setup
  • SAS-函数(三),这几个函数你都知道吗~

    昨天最后的一个函数是Lag,那么今天的第一个函数是和昨天的lag很类似,Lag可以将前一条观测下移,然后求差值,那么今天这个函数是可以直接求上下观测的差值......

    Setup
  • SAS-最近的一点心得...

    不知不觉已是中秋了,感觉时间过的好快...2019已经过大半了...今年还有好多事没有做,深感内疚与自责!

    Setup
  • Android双向滑动菜单完全解析,教你如何一分钟实现双向滑动特效

    记得在很早之前,我写了一篇关于Android滑动菜单的文章,其中有一个朋友在评论中留言,希望我可以帮他将这个滑动菜单改成双向滑动的方式。当时也没想花太多时间,简...

    用户1158055
  • 『互联网架构』软件架构-netty之websocket协议应用实践(59)

    为了解决上述弊端,Html5定义了WebSocket协义能更好的节省服务器资源和宽带达到实时通信的目的。

    IT故事会
  • Linux服务器更换主板后,网卡识别失败的处理方法

    1)现象说明 公司IDC机房里的一台线上服务器硬件报警,最后排查发现服务器主板坏了,随即联系厂商进行更换主板,最后更换后,登录服务器,发现网卡绑定及ip信息都在...

    洗尽了浮华
  • python 安装 cx_Oracle

    需要的lib库: yum install gcc libffi-devel python-devel openssl-devel

    py3study
  • TIMSDK 常见问题

    构建消息元素后,实例化一个 TIMMessage 对象,然后调用 addElement() 方法构建到 TIMMessage 消息对象中,不推荐在同一个消息对象...

    腾讯云-ahqzhang
  • Greenplum架构和核心引擎

    https://www.bilibili.com/video/av81898649?p=1

    小徐
  • Greenplum 架构和核心引擎

    https://www.bilibili.com/video/av81898649?p=1

    小徐

扫码关注云+社区

领取腾讯云代金券