前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【SAS Says】基础篇:7. SAS宏初步

【SAS Says】基础篇:7. SAS宏初步

作者头像
数说君
发布2018-04-08 11:30:31
3K0
发布2018-04-08 11:30:31
举报
文章被收录于专栏:数说工作室数说工作室

宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。

总之,宏可以降低重复性工作的任务量,使程序模块化。

本节目录:

7.1 宏概述

7.2 用宏变量提交文本

7.3 用宏创建一个模块化的代码

7.4 给宏增加参数

7.5 使用条件逻辑写宏

7.6 用call symput编写数据驱动程序

7.7 排除宏错误的bug


【SAS Says】基础篇:7. SAS宏初步

7.1 宏概述

宏以前被认为是经验老道的SAS程序员使用的高级技术。但现在新手也能够了解一些。幸运的是,宏的基本功能不是那么难理解。本章介绍的最普遍使用的SAS宏语言的特征。

宏处理器 标准SAS程序中,提交程序后,SAS就编译并立即执行。但宏语句多了一步,在提交之后,SAS会将宏语句传送到宏处理器上,将其转变为SAS标准代码,通常叫做“变换代码”(meta-programming.)

宏和宏变量 SAS宏代码包括两个基本部分:宏命令和宏变量。宏变量通常加一个“&”作为前缀,而宏命令通常加一个“%”作为前缀。

局部VS全局 宏变量有局部宏变量和全局宏变量。如果在宏的内部定义则为局部宏变量,只能在内部使用。如果在开放代码中定义则为全局宏变量。避免两种错误:在宏之外(开放代码)使用局部变量;创建同名的局部变量和全局变量。

启动宏处理器 使用宏指令之前必须将宏系统选项打开,尽管有时默认是打开的。可以用下面代码查看是否打开:

PROC OPTIONS OPTION=MACRO;

RUN;

查看日志,如果看到MACRO,则打开了;如果看到NOMACRO,则没有打开。

避免宏错误 宏会让人很头痛,可以通过分段形式避免。首先,用SAS标准语言写下程序;接着,将其转变为宏代码。

7.2 用宏变量提交文本

用%let创建一个宏变量 最简单给宏变量分配一个值的方法是%let,基本形式为:

%LET macro-variable-name=value;

宏变量名必须符合SAS命名法则,(少于等于32字节、以字母或下划线开头、只能包括字母、数字和下划线),下面创建了宏变量:

%LET iterations=10;

%LET country=New Zealand;

当赋值字符串时,不需要加引号。除非开头和结尾的空格,否则从等号到分号的全部内容都是变量值。

使用宏变量 宏变量前面要加前缀&,注意宏处理器找不到单引号内的宏变量,只能用双引号。如下的例子:

DO i=1 to &iterations;

TITLE ”Addresses in &country”;

经宏处理器编译后,语句变成:

DO i=1 to 10;

TITLE ”Addresses in New Zealand”;

例子 一份关于花店销售的数据,变量为顾客ID,销售日期,花的种类,数量:

想要一份反映某一种类型花的销售情况数据,宏变量就可以不用编辑数据步和过程步来选择一种花种:

结果如下:

7.3 用宏创建一个模块化的代码

宏可以使一段代码在一个或多个程序中被反复使用,而不需要重复的去编写相同或相似的代码。基本形式为:

%MACRO macro-name;

macro-text

%MEND macro-name;

%MACRO语句告诉SAS这是宏开始,而%MEND则意味着结束。macro-name是自己命名的,但mend后面的macro-name则是可选的,但加入会使得句子好很多(easier to debug and maintain)。

启动宏 定义了宏之后,可以通过在宏名称前面增加%来启动宏:%macro-name,注意这里可以不用分号。

例子 使用前面花店销售的数据:

下面的代码创建了一个名为%SAMPLE的宏,来将数据按照Quantity排序,打印出最大销售额的五个观测值。然后用标准数据步读取数据,并启动宏:

结果为:

这样的宏有些限制,因为它只能做一件事。现在结合%let语句,并增加参数使得其更加灵活

宏自动呼叫库 本书中的宏仅在一个程序内部定义和启动。也可以将宏储存在一个中心位置,叫做自动呼叫库,被各个程序分享。具体来说,将宏作为文件储存在某路径中,或作为分区数据集中的一员。使用MAUTOSOURCE和SASAUTOS=系统选项告诉SAS在哪里查找宏。之后,即使宏没有出现在程序中,也可以启动它了。

7.4 给宏增加参数

参数就是宏的变量,给宏增加参数,在%MACRO语句中的括号内列出宏变量的名字。基本形式为:

%MACRO macro-name(para-1=,para-2=,...para-n=);

macro-text

%MEND macro-name;

比如,一个叫做%QuarterlyRepott的宏可能这样开始:

%MACRO QuarterlyReport(quarter=,salesrep=);

这个宏有两个参数&QUARTER 和&SALESREP。启用这个宏可以用这样的语句:

%quarterlyreport(quarter=3,salesrep=Smith)

例子 仍然是花店销售例子:

现在需要一份报告,反映每位对每位顾客的销售。下面的代码定义了宏%SELECT,并启动两次。这个宏排序并打印数据FlowerSales,使用参数创造了两位命为&CUSTOMER和&SORTVAR的宏变量:

结果为:

7.5 使用条件逻辑写宏代码

在宏中使用条件逻辑的基本形式为:

%IF condition%THEN action;

%ELSE%IF condition%THEN action;

%ELSE action;

%IF condition%THEN%DO;

SAS statements

%END;

自动宏变量 每一次启动SAS,宏处理器自动创建一些宏变量,可以使用在程序中。最常见的有:

比如,可以像这样结合自动宏变量和条件逻辑语句:

%IF &SYSDAY=Tuesday %THEN %LETcountry=Belgium;

%ELSE %LET country=France;

例子 仍然是花店销售数据:

现在想在周一和周四的时候打印报告,代码如下:

当程序提交之后,宏处理器将会写下如下代码:

如果这段代码是周四写的,那么结果如下:

7.6 用call symput编写数据驱动的程序

分配一个值给宏变量,可以使用callsymput:

CALL SYMPUT(”macro-variable-name”,value);

macro-variable-name是变量名,value可以是一个变量名,该变量的值将分配给macro-variable-name,也可以是一个用引号括起来的常量。

call symput通常在IF-THEN语句中使用:

IF Age>=18 THEN CALL SYMPUT(”status”,”Adult”);

ELSE CALL SYMPUT(”status”,”Minor”);

这个语句创建了宏变量&STATUS,并依据年龄情况分配给值adult或minor。下面的代码使用变量来赋值:

IF TotalSales>1000000 THEN CALL SYMPUT(”bestseller”,BookTitle);

注意 用call symput创建的宏变量与赋值变量不能够用在同一个数据步中。因为直到数据步执行之后,SAS才会将一个值赋给宏变量。

例子 仍然是花店销售的数据:

现在想找到单个订单最大的客户,并打印出这个客户的所有订单。

第一段代码读取原始数据,proc sort按照quantity降序排序,最大单个订单将会出现在第一个观测值上。

第二段代码使用call symput,当_N_为1 的时候,分配变量CustomerID的值给宏变量&SELECTEDCUSTOMER,在数据步中,我们所需要的就是这么多,因此使用stop语句告诉SAS停止数据步。Stop语句也可以不要,但为了提高效率,它可以告诉SAS不要再读取下面的观测值了。

第三段代码,此时SAS直到数据步已经结束,因此执行数据步。宏变量&SELECTEDCUSTOMER的值为356W,结果如下:

7.7 排除宏错误的bug

避免宏错误 尽可能先用标准SAS代码写你的程序,当没有错误了,再转成宏代码,先一次增加一个宏逻辑特征。再增加%macro和%mend。再增加宏变量。

引用问题 宏处理器不能解决但引号内的宏。所以要使用双引号。比如下面的例子,单引号不能读取宏变量的值:

排除宏错误bug的系统选项 这五个系统选项会影响SAS写入日志的信息。粗体为默认的设置。

  • MERROR|NOMERROR 如果你调用了一个SAS不能找到的宏,则会报警。
  • SERROR|NOSERROR 如果你使用了一个SAS不能找到的宏,则会报警。
  • MLOGIC|NOMLOGIC SAS会在日志里打印关于执行宏的详细信息。
  • MPRINT|NOMPRINT SAS在日志里打印由宏产生的标准SAS代码。
  • SYMBOLGEN|NOSYMBOLGEN SAS在日志里打印宏变量的值。

最好只在排除bug的时候才将MLOGIC,MPRINT和SYMBOLGEN打开,否则它会让你的日志阅读起来很困难。想要关闭,则用系统语句:

OPTIONS MPRINT NOSYMBOLGEN NOMLOGIC;

Merror信息 如果SAS不能找到一个宏,并且Merror选项也是开着的,那么SAS会打印这样的信息:

WARNING:Apparent invocation of macro SAMPL not resolved.

确认宏名字的拼写是否正确。

SERROR信息 如果SAS不能在开放代码中处理一个宏变量,并且serror选项是开着的,SAS会打印这样的信息:

WARNING:Apparent symbolic reference FLOWER not resolved.

首先确认是否拼写错误,再次查看视角,即是否在外部使用了一个局部变量。

MLOGIC信息 如果这个选项开启,SAS会在日志中打印由宏产生的SAS语句。如果在MPRINT选项中运行了%SAMPLE,日志会如下所示;

SYMBOLGEN信息 如果这个选项开启,SAS会在日志窗口中打印每个宏变量的值。如果在SYMBOLGEN选项中运行%SAMPLE,日志会如下所示:


本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-10-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数说工作室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 7.1 宏概述
  • 7.2 用宏变量提交文本
  • 7.3 用宏创建一个模块化的代码
  • 7.4 给宏增加参数
  • 7.5 使用条件逻辑写宏代码
  • 7.6 用call symput编写数据驱动的程序
  • 7.7 排除宏错误的bug
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档