专栏首页素质云笔记SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号

SAS︱操作语句(if、do、select、retain、array)、宏语言、统计量、运算符号

SAS中的一些常见的符号。运算符是一种符号 ①比较算符 ②算术算符 ③逻辑算符 ④其它算符

运算符号

比较算符

含义

#NAME?

等于

^= 、 NE

不等于

> 、 GT

大于

< 、 LT

小于

>= 、 GE

大于等于

<= 、 LE

小于等于

IN

等于列表中的一个

算术算符

比较算符

含义

**

乘方

*

/

+

-

逻辑运算符

运算符

含义

^、NOT

逻辑非

&、AND

逻辑与

|、OR

逻辑或

——————————————————————————————————————————————————————————

一、操作语句

1、if语句

/*if语句*/
if x then delete;
if x=1 then y=1;
else
if x=2 then y=2;else
y=3;
/*抒写结构很有趣*/

if status in (1,2) then newstat="single";
else newstat="not single";
/*表达式的写法*/

if代表判断,为真则执行then后面的内容。 其中newstat代表新的变量。

用途1:筛选变量

data d1 d2;  
set sashelp.class;  
if _n_ le 10 then output d1;  
else output d2;  
run;  

其中的le 代表小于等于10,

用途2:do强化if的效率

If age>14 then hcm=30.5*height/12;

if age>14 then do;hcm=30.5*height/12;end;

对比一下两个的关系,第一个是传统的if-then的组合,后面加上do-end,看上去多余,但是这样做之后,可以极大的增加运算效率。

2、select语句

select语句
select;
when (a=1) x=a*10;
when (a=2);
when (a in (3.4.5)) x=a*100;
otherwise;
end;

类似if-then代表着如果when满足a=1,则x=a*10。

不过需要注意繁杂的的otherwiese 以及end作为必要后缀。

3、do语句

DO语句必须由一个END语句来结束。DO和END语句之间的这些语句称为一个DO组。

do语句有三类样式:简单DO语句;循环DO语句;do over语句

第一类的简单do,可见if中的用途2,强化了if的效率

第二类do,实质是循环,下面有一些常用写do语句的方式:

do i=1 to n ;
do i=n to 1 by –1;
do i=1 to k-1, k+1 to n;
do i=2, 3, 5, 7, 11, 13, 17;
do i=0.1 to 0.9 by 0.1, 1 to 10 by 1, 20 to 100 by 10;
do i='saturday', 'sunday';
do i=‘A’ to ‘Z’;

一个例子:自然数求和、自然数平方和

自然数求和、自然数平方和
data a2;
t=0; s=0;
  do n=1 to 100;
  t=t + n;/*n累加*/
  s=s + n**2;/*n2累加*/
  output;
  end;
run;

4、array语句

ARRAY语句用于定义数组。数组通常由一组变量构成。利用数组可以简化很多复杂的数据处理过程。 SAS系统引用数组等价于引用构成数组的那一组变量。

data aa2;
array c{4} (2,4,6,8);
run;

5、retain语句——变量存储

利用retain语句可以很方便地实现观测值累加、累乘、缺失观测填充等复杂的数据处理。

(1)用于填充缺失值:

data a12;set resdat.ymret;
retain yret1;
if yret^=. then yret1=yret;
run;

在yret^=.的情况下为yret1赋值为yret,其它情况并没有为yret1赋值。由于retain语句的作用,yret1保留前面的值, 这样yret1不会有缺失值,从而起到填充的作用 。

(2)分组加上组序号:

分组,加组序号
proc sort data=a12;by stock year;run;
data a13;set a12;by stock year;
retain num 0;
if first.stock then num=num+1;
run; 

——————————————————————————————————————————————————————————

二、宏语言

SAS宏的一些特性: 1)可以降低重复性任务的工作量,便于重复调用。例如:可以将宏文件永久存储,每次只需要调用相应的宏就可以完成分析,而无需重新运行。 2)使程序模块化,同时便于修改宏参数,而无需重新运行,可以大幅提高运行效率。

1、sas宏变量——可复用的值

一个可以广泛复用,一直保存在缓存中的变量内容。 一种在程序(这里一般是指一个宏程序)外定义,则在整个SAS任何地方都可以被调用。另外一种则是在程序内部,则作用在该程序出现宏变量后面,在程序外则不可以被调用,否则会出错。(如果一个程序内部定义有宏变量变成全局变量,则需要使用%global)(这句话参考自: SAS 定义宏的三种用法

(1)%let

%let a=XXX;
%put &a;
%put here is &a;

显示:
xxx
here is xxx

通过%let定义宏变量,格式:%let 宏变量名=宏变量值;

定义了宏变量之间,需要print一下,就要使用%put,相当于print 一下。 还有这样的用法:

%let var=you;
data w1;
X="here is &var";
run;

直接用在的文本之中,作为嵌入式。

(2)%str()

另外宏变量的定义方式有:当宏变量一个表达式,使用:%str() %let print=%str(proc print; run;);

(3)%eval()

如果宏变量是数值计算表达式,则需要根据数值类型使用二个不同的宏变量: %eval_r() 用于计算整数例如:%eval_r(1+2) %sysevalf() 用于计算浮点数或者空值例如: %eval_r(1.0+2.3)

还有一种就是%eval(),%eval把字符型值变成数值型。

2、宏程序——可以复用程序(函数雏形)

类似R中的Function,不过这里可以完整将代码存在一个函数里面,下次可以重复调用。

% macro test;
data a2;
X=1;
run;
%mend test;

%test;

%macro test; 以及 %mend test; 代表着宏程序的开始与结尾,下次调用的话,就直接%test;即可。

不过,要下次开机之后再用的话,必须地永久得对宏进行存储,就像函数一样。

存储的代码:

/*存储宏程序*/
libname test '';
options mstored sasmstore=test;
% macro test/store;
data a2;
X=1;
run;
%mend test;

/*调用宏程序*/
libname test '';
options mstored sasmstore=test;
%test;

其中,options mstored sasmstore=宏名称; 是关键,同时,% macro test/store;存储时候中需要加入/store

3、宏参数——类函数

其实觉得宏程序其实没啥用,宏程序的升级版,宏参数才是最有用的,宏参数类似函数一样。

%MACRO A;
        1
%MEND A;

%MACRO B(x,y);
        %let z=%eval(&x+&y);
        %put &z;

%MEND B;

%B(13,%A);

来看看来自经管之家论坛一篇帖子的内容,我觉得把宏变量、宏参数演绎得淋漓尽致。

通过%macro %mend把A定义为1,以便可以复用;

然后%eval把字符型值变成数值型(关于这个需要深究一下,还有%str的用法)。

其中%B就代表调用函数,然后进行计算。

———————————————————————————————————————————————————

三、统计量

对数据集的操作。

data m15;set m14;
  data1=nobs**2;/*乘方用**表示*/
  data2=int(size);/*int:取整*/
  data3=ceil(size);/*返回大于等于变量的最小整数值*/
  data4=floor(size);/*返回小于等于变量的最大整数值*/
  data5=sqrt(data1);/*平方根*/
data6=exp(nobs-1);/*e的x次方*/
  data7=log10(asset);/*以10为底的对数*/
  data8=round(size,0.01);/*保留2位小数后的四舍五入结果*/
  data9=mod(nobs,2);/*求前者除以后者的余数*/
  data10=sign(log(mv)-log(asset));/*符号函数,对正数返回1,0返回0,负数返回-1*/
  data11=max(log(mv),log(asset));
  data12=min(log(mv),log(asset));

run;

里面包括:乘方、取整、平方根、指数、对数、最大、最小值。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • GAN︱生成模型学习笔记(运行机制、NLP结合难点、应用案例、相关Paper)

    我对GAN“生成对抗网络”(Generative Adversarial Networks)的看法: 前几天在公开课听了新加坡国立大学【机器学习与视觉...

    素质
  • pySpark | pySpark.Dataframe使用的坑 与 经历

    笔者最近在尝试使用PySpark,发现pyspark.dataframe跟pandas很像,但是数据操作的功能并不强大。由于,pyspark环境非自建,别家工程...

    素质
  • 笔记︱集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合

    本文参考:模型融合的【机器学习】模型融合方法概述 概况有五个部分:Voting、Averaging、Bagging 、blending、Boosting、 S...

    素质
  • 教你一招搞定 GitHub 下载加速!

    众所周知,GitHub 是一个巨大的开源宝库,以及程序员和编程爱好者的聚集地,包括我之前推荐的诸多优秀的开源项目全部都是位于 GitHub 上。

    崔庆才
  • 微软收购 GitHub 后的各路网友反映

    All these people saying they'll move to Gitlab because of MS buying GitHub, remi...

    HyperAI超神经
  • 马斯克、吴恩达等27人出镜:AI可能成为不朽独裁者,人类就像蚂蚁束手就擒

    【新智元导读】今天,AI纪录片《你信任这台电脑吗?》上线,马斯克在推特上力荐。不仅是因为马斯克出镜,更重要的是他认为AI可能成为不朽的独裁者。这部纪录片的另一大...

    新智元
  • JDK源码分析-AbstractQueuedSynchronizer(2)

    前文「JDK源码分析-AbstractQueuedSynchronizer(1)」初步分析了 AQS,其中提到了 Node 节点的「独占模式」和「共享模式」,其...

    WriteOnRead
  • GitHub安全最佳实践

    Github 类的代码平台是个研发和安全人员的大宝库,阿里云效平台的代码权限事件历历在目,密码泄露到公开代码平台的事件层出不穷,为企业内外部的各种源代码...

    Ramos
  • 全球开发者福利,GitHub终于出App了

    今天,在全球开发者大会上,按照惯常,为了让开发者更轻松地写代码,GitHub发布了诸多重大更新,其中包括GitHub Actions正式应用、新功能GitHub...

    镁客网
  • 该如何弥补 GitHub 功能缺陷?

    自从被微软收购之后,GitHub 就像腾飞的火箭一样,接二连三地发布新功能,比如免费的私有代码仓库、GitHub 赞助商项目等,都获得了开发者社区的青睐。

    GitHubDaily

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动