专栏首页王小雷SAS进阶《深入解析SAS》之对多数据集的处理

SAS进阶《深入解析SAS》之对多数据集的处理

SAS进阶《深入解析SAS》之对多数据集的处理

1. 数据集的纵向串接:

数据集的纵向串接指的是,将两个或者多个数据集首尾相连,形成一个新的数据集。
据集的横向合并:
数据集的横向合并,指的是将两个或者多个数据集根据某种原则横向合并起来,形成新的数据集。

2. 数据集的纵向串接两种方法:1)使用SAS DATA步的SET语句。2)使用SAS过程步的APPEND过程。

2.1. 使用SET步纵向串接形式如下:
DATA 新数据集;
    SET 数据集1 数据集2 <数据集3 数据集4 ...>;
    BY 变量1 <变量2 变量3 变量4...>;
RUN;

使用APPEND过程
PROC APPEND BASE=主数据集 <DATA=追加数据集> <FORCE>;
2.2. 使用APPEND过程,SAS不会处理主数据集中的观测,而是直接将追加数据集的观测添加到主数据集最后一条观测后面,且变量仅包含主数据集中的变量。

3. 数据集的横向合并使用MERGE的两种情况:

不使用BY语句合并,也称为一对一合并。
DATA WORK.COMBINED;
    MERGE WORK.DATA1 WORK.DATA2;
RUN;
一对一合并原则:1)新数据集的第一条观测包含各个输入数据集中第一条观测的信息,第二条观测包含各个数据集中第二条观测的信息,不足的观测用缺失值不足。2)新数据集含有的观测数为所有输入数据集的最大观测是数。

使用BY语句合并,也称为匹配合并。
DATA WORK.COMBINED;
    MERGE WORK.DATA1 WORK.DATA2;
    BY Year;
RUN;

4. 使用数据集选项IN=操作观测

数据集选项IN=可以运用在SET、MERGE、MODIFY、UPDATE语句中的任何数据集后面。

5. 数据集的更新UPDATA

DATA 新数据集;
    UPDATA 主数据集 更新数据集
            <UPDATATE=MISSINGCHECK | NOMISSINGCHCK>;
    BY 变量1 <变量2 变量3 变量4...>;
RUN;

6. UPDATE语句和MERGE与的区别:

1)UPDATA语句只能操作两个数据集;MERGE语句可以对两个或者两个以上数据集进行操作。
2)使用UPDATA语句时必须使用BY语句;MERGE语句在不使用BY语句时也可以按观测号进行一对一合并。
2)在处理缺失值时,UPDATA语句可以控制是否用缺失值对主数据集进行替换;MERGE语句中后一数据集中的缺失值一定能会覆盖前一数据集中的值。
4)当BY变量值在后一数据集或者更新数据集中不唯一时,UPDATA语句和MERGE语句的处理方式不一样。

7. 数据集的更改

7.1 单个数据集的更改MODIFY语句
DATA 原数据集;
    MODIFY 原数据集;
RUN;
7.2 两个数据集的更改MODIFY语句
DATA 主数据集;
    MODIFY 主数据集 修改数据集;
    BY  变量1  <变量2 变量3 ...>;
RUN;

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pipeline大数据架构

    Pipeline大数据架构,面向大数据仓库和大数据处理平台。是基于lambda的大数据架构的变种,增加了企业级服务,而并非只是大数据组件的对切,是一种更落地的方...

    王小雷
  • SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作

    版权声明:本文为王小雷原创文章,未经博主允许不得转载 https://blog.csdn.n...

    王小雷
  • mybatis学习笔记之学习目录(1)

    学习结构: 1.mybatis开发方法 原始dao开发方法(程序需要编写dao接口和dao实现类) mybatis的mapper接口...

    王小雷
  • 微瑞思创CTO周像金:大数据需求方、供给方及从业者走过的2016

    数据猿导读 大数据从2015年开始就已经在Gartner的技术成熟度曲线图上消失了。这表明,对大数据概念的炒作已经进入了尾声,大数据已经融入到了各行各业中,企业...

    数据猿
  • BAT加持下的大数据,新行业驱动器的繁华与苍凉

    互联网时代的落幕让人们开始寻找新的突破口和增长点,科技巨头也不例外。今年云栖大会的主题是“数字驱动中国”,大数据在驱动传统行业的过程当中的作用开始愈加明显。阿里...

    孟永辉
  • 传统生意与产品,终将被大数据摧毁?

    有一部影片叫《预见未来》,影片中尼古拉斯·凯奇饰演的男主角能够预测未来2分钟内的人和事,从而根据预测做出最优决策。这种神奇的超能力对于当时的人们来说是不可能完成...

    华章科技
  • 探码大数据采集系统让数据可视化变得更简单!

    数据可视化,是指将相对晦涩的的数据通过可视的、交互的方式进行展示,从而形象、直观地表达数据蕴含的信息和规律。步入大数据时代,各行各业对数据的重视程度与日俱增,随...

    用户5290619
  • 2016年大数据专家值得期待的8件事

    随着经济的复苏,全行业又掀起了雇佣潮,企业更偏向技能娴熟的应聘者。当然,这在聘用大数据专家时也一样奏效。数据质量总监、软件工程师、平台软件工程师、数据库工程师...

    灯塔大数据
  • 全球互联网经济大会举行 论大数据该如何应用

    事件 9月7日~8日,全球互联网经济大会在北京国际会议中心召开,腾讯、阿里、百度、网易等近106家互联网企业参与。论坛以“移动、金融、大数据”为主题。近年来,...

    灯塔大数据
  • 数据猿探访最“Cool”大数据公司—— 百分点:让数据变得有想象力

    <数据猿导读> 百分点作为Gartner近期发布的 “Gartner 2016 Cool Vendors in China”报告中唯一当选的大数据技术与应用服务...

    数据猿

扫码关注云+社区

领取腾讯云代金券