SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

1. SAS变量操作的常用语句

ASSIGNMENT 创建或修改变量
SUM     累加变量或表达式
KEEP    规定在数据集中保留的变量
DROP    规定在数据集中删除的变量
ARRAY    定义一个数组
RENAME   重命名数据集变量
LENGTH   定义变量长度
LABEL    定义变量标签

2. 连接符:||

compress:消除空格
RETAIN应用:一是需要对某一个变量值进行累加、比较等操作。二是需要保留之前的某一满足条件的变量值到指定的观测对应的变量。

3.维度函数:MID() DIM(MULT)等加于DIM(MULT,1)

LABEL:标签

4. SAS观测值操作

OUTPUT 输出当前在PDV中的观测,继续无条件自行下面的语句。
IF   如果满足条件,继续执行后面语句;否则,返回DATA步开头。
WHERE  观测进入PDV之前进行条件判断。
REPLACE 更新观测,但仅在MODIFY语句中适用。
REMOVE 删除观测,但仅在MODIFY语句中适用。
DELETE 如果满足条件,返回DATA步开头;否则继续执行后面语句。
STOP  停止输出当前PDV中的观测,并退出DATA步。

WHERE语句在PDV之前执行。

5. 数据集管理主要包括数据集纵向拼接、转置、排序、比较、复制、重命名、删除等操作。通过SAS的过程步完成,常用过程步。

APPEND 把来自SAS数据集的所以数据添加到另外一个SAS数据集的后面。
SORT  对原有SAS数据集安装一个或多个变量进行排序。
TRANSPOSE  对原有的SAS数据集进行行列转置
CONTENTS  输出SAS逻辑库成员的描述信息
DATASETS  管理SAS逻辑库成员,可以完成对SAS逻辑库中的所有成员进行输出列表、复制、换名、添加和删除等操作。
实践:在PROC SORT中用了NODUPKEY后最好一同使用OUT,OUT可以保证原来的数据集不变,把NODUPKEY后的产生的观测输出到新的数据集中。(万一程序开发有误,有保障) 
带OUT=选项的删除重复BY值
    data a;
      input x y @@;
      cards;
      1 20 1 10 1 30 2 40 2 50
      ;
    run;
    proc sort data=a nodupkey out=b;by x;run;

6. 行列转置实践

DATA比PROC效率高
对比:
6.1 列转置为行
  PROC步:
    proc transpose data=chapt6.fishdata
      out=charpt6.fishlength(rename=(coll=measurement));
      var length1-length4;
      by location date;
    run;
  DATA步:
    data chapt6.fishlength2;
      set chapt6.fishdata(keep=location data length1-length4);
      array tr[1:4] length1-length4;
      do i=1 to 4;
      measurement=tr(i);
      output;
      end;
      keep location date measurement;
    run;
6.2 行转置列
  PROC步:
    proc transpose data=chapt6.fishlength
      out=chapt6.fishdata2;
      var measurement;
      by location date;
      id _name_;
    run;
  DATA步:
  data chapt6.fishlength(keep=location date measurement);
      do i=1 to 4;
      set chapter6.fishlength(keep=location date measurement);
      array tr[1:4] length1-length4;
      tr(i)=measurement;
      end;
      keep location date length1-length4;
    run;

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏每日一篇技术文章

OpenGLES_实战04_教你绘制球体

写这篇文章主要给初学者一个绘制球体的思路,苹果给我们封装的类,帮助我们简化了不少代码,如果纯OpenGL 做这样一个练习代码量还是挺多的。

1271
来自专栏GreenLeaves

SQL学习之汇总数据之聚集函数

一、 1、我们经常需要汇总数据而不用把他们实际检索出来,为此SQL提供了专门的函数,以便于分析数据和报表生成,这些函数的功能有: (1)确定表中行数(或者满足单...

1945
来自专栏极客猴

Django 学习笔记之模型高级用法(下)

除了抽象模型,在模型中定义的字段都会成为表中的列。如果我们需要给模型指定其他一些信息,例如排序方式、数据库表名等,就需要用到 Meta。Meta 是一个可选的类...

812
来自专栏Alan's Lab

iOS一点点 - TableView 拼音序排序(汉字转拼音、简繁体转换、日文转罗马音等)

Introduction to ICU General Transforms Transform Rule Tutorial 使用ICU进行拼音转汉字暂时似乎也...

1552
来自专栏专注研发

JAVA库函数总结【持续更新】

1431
来自专栏osc同步分享

回溯算法思想与八皇后问题解的个数

八皇后问题: 在8*8的国际象棋棋盘上,皇后是威力较大的棋子,它可以攻击到与自己同行、同列以及同一斜线上的棋子,如下图,所有橙色格子上的棋子,都可能会被皇后攻击...

3737
来自专栏wym

python实现opencv学习七:图片色素的数值运算(加减乘除)和逻辑运算(与或非异或)

例图:(若想用下面两张图可另存为图片,若保存的文件无后缀,添加后缀为.jpg即可)

2484
来自专栏linux、Python学习

必备神技能 | MySQL 查找删除重复行

本文讲述如何查找数据库里重复的行。这是初学者十分普遍遇到的问题。方法也很简单。这个问题还可以有其他演变,例如,如何查找“两字段重复的行”(#mysql IRC ...

530
来自专栏从流域到海域

迪杰斯特拉(Dijkstra)算法求图中最短路径

迪杰斯特拉(Dijkstra )算法: 对于图G=(V,E),将图的顶点分为两组: 顶点集S:已求出的最短路径的顶点集合(初始为{v0}); 顶...

1997
来自专栏书山有路勤为径

Day and Night Image data Standardization

802

扫码关注云+社区