特别说明:本节【SAS Says】基础篇:SAS宏初步,用的是数说君学习《The little SAS book》时的中文笔记,我们认为这是打基础的最好选择。 转载请在文章开头注明微信号:shushuojun,谢谢! 宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。 总之,宏可以降低重复性工作的任务量,使程序模块化。 本节目录: 1. 宏概述 2. 用宏变量提交文本 3. 用宏创建
宏用来处理重复工作最好,比如你需要跑10个回归,用proc reg...,这10个回归其他都一样,就是因变量y每次需要换。那么将回归程序写成一个宏,每次用的时候换参数就可以了。 总之,宏可以降低重复性工作的任务量,使程序模块化。 本节目录: 7.1 宏概述 7.2 用宏变量提交文本 7.3 用宏创建一个模块化的代码 7.4 给宏增加参数 7.5 使用条件逻辑写宏 7.6 用call symput编写数据驱动程序 7.7 排除宏错误的bug ---- 【SAS Says】基础篇:7. SAS宏初步 7.1 宏
如题,今天小编要分享的内容是如何自动化创建描述性统计分析的SAS程序。关于描述性统计分析相关内容一般可编写一个宏程序,通过填写变量与相应的参数来快速生成分析表格的结果。如果这样宏程序需要写的很完善,那么就是一个非常大型嵌套宏。由于最新的指导原则要求不能调用外部宏和嵌套宏,为了提高工作效率、减少错误率等,于是本文诞生了。
不管是在data步中,还是在宏中,都是会有条件判断,在data步中有if ...then ...在宏中也是有该语句的,不过得加上%号,那就是 %if ....%then ...还是先来看一段代码,来看看宏中的%if语句...
今天小编要分享一段根据Specification文件自动加工分析数据集的小程序,可以实现自动修改分析数据集变量标签、变量顺序、观测排序、变量属性、检验是否有遗漏变量及抓取其他数据集中的变量。好像功能说了一大堆,其实都是一些小功能,当然一些小功能也能很好的节省工作量,提高工作效率。
本文介绍了SAS宏语言、SQL过程、多表操作、数据合并查询、数据集操作、数据存储和SQL多表操作等方面的内容。
前面小编写了SAS-交叉表的自动输出。今天小编打算分享不良事件中常见统计分析表格的几种样式,及自动生成的SAS程序与编程思路。嗯,关于不良事件的分析,常见均是对SOC/PT的例次、例数进行分析。
在编程过程中,日期、时间的处理是很常见的,SAS中也有很多日期处理相关的语法或函数,那么今天就与小编一起来看看,针对日期、时间的哪些编程的语句....
上一篇“高级篇:IML(1)”发出来之后,有朋友反映东西东西太简单了,根本不能算“高级”。想想也是,暂时还没有介绍太复杂的SAS程序,于是决定将本篇定为“扩展篇”,SAS Says系列安排如下: 【SAS Says】基础篇 主要介绍SAS软件的一些基本入门知识,包括画图、ODS、导入导出数据数据格式等。已经更新完,可以回复M,进入目录,点击链接查看。 【SAS Says】统计篇 介绍SAS统计方面的一些应用,包括主成分、判别分析、logistic模型、非参数检验等等。统计篇需要晚些才能与大家见面。 【SAS
在说正文前,小编还是要插播一下小编今年的一次面试经历。今年,小编去5家公司面试了,恩,从5月份开始,差不多一个月去一家公司面试,前俩家被拒,后三家都拿到offer了。
大家都知道SAS数据集中的变量是分数值型、字符型的。那么SAS的宏变量是否分数值型变量和字符型变量呢?是不分的,那么宏变量的计算是直接算么?当然是不是的,宏变量的计算是有俩个关键词%eval(只能进行整数的运算),%sysevalf(可进行整数运算与小数运算)....
本文是【SAS Says】系列的扩展篇第四文,5分钟带您看懂IML中的模块功能,它类似于创建一个函数。 用20分钟玩手机,不如花5分钟跟Ansta学习SAS。 数说工作室 || 大数据 云计算 高逼格 【SAS Says】系列 主要介绍银行、证券、大型外企、药厂常用的统计软件SAS的使用。 1. SAS 软件入门 2. 读取数据 3. 描述数据 4. ODS的使用 5. 开发数据(一) 6. 开发数据(二) 7. SAS宏初步 8. 相关、回归等初步统计 扩展篇已经更新到第四文,直接点击查看前面内容: 【
第一篇“Think Sas”中的“Think”,纯粹做“考虑”解,说,诸君如果为工作计,不妨考虑下SAS。下面说些关于SAS本身的一些思考与认识。俗话说,人类一思考,上帝就拍砖。上一篇是纯劝导型,这一篇就是求拍砖型。 0.总结与回应 在展开讨论之前,希望大伙对“事实问题”而不是“价值问题”能有一个统一的认识,这也是我对上篇各位的评论的一个总结与回应。 0.1 功能:SAS 与R 一些朋友询问SAS或R或其他软件功能的优劣,然后决定自己应该着手学哪个。这是一个
说到Macro,那么就不得不说宏变量,宏变量的是啥呢?可以理解成和其它编程语言中的变量一样,在内存中创建了一个空间(给这个空间一个标记,宏变量的名称),然后将一些值放到这个内存空间中(这就是定义宏变量的过程),好吧,我是一个不善解释的人,没理解的还是自行百度领悟。那么就来看看如何来定义Macro变量。
懒惰的小编好像开启了一月一更的模式了,许久未写编程中的小技巧了,于是今天小编打算分享几个编程中的小技巧。
今小编这里说的快捷键,并不是通俗意义上的那种CTRl+A、CTRL+C的这种快捷键,而是SAS编程里面的宏功能键(我称“快捷键”)。改键的使用,可实现设置代码块,以后只敲击代码块的缩写,自动就弹出代码。
今天分享的是SAS软件使用过程的中的几个小技巧,掌握了一些小技巧,编程的效率会提高的更快,还能减少敲代码出错率,好处很多,小编就不一一赘述了。 ----Setup~ 1 快捷键(功能键的使用) 今小编这里说的快捷键,并不是通俗意义上的那种CTRl+A、CTRL+C的这种快捷键,而是SAS编程里面的宏功能键(我称“快捷键”)。改键的使用,可实现设置代码块,以后只敲击代码块的缩写,自动就弹出代码。 01 看效果 1.以输入CSV为例 2.输入回车
这样做的的好处是啥呢,每次运行数据或者数据集想实现自动存下来,这个时候就可以用SAS自动创建文件夹的方式来存储。
SAS中的一些常见的符号。运算符是一种符号 ①比较算符 ②算术算符 ③逻辑算符 ④其它算符
从第一天学习SAS开始,就摆脱不了看SAS日志,每次运行完程序的第一件事,不是看程序运行的结果,而是点击一下Log页面,第二件事也不是去看结果,而是仔细的浏览Log里面,有没有红色的字体出现(ERROR),有没有绿色的字体出现(WARNING),接着在看有没有黑色的_ERROR_=1出现(出现这种情况,一般是你的数据不满足条件或者语法有问题,下面会有例子),接着还得再看看有没有蓝色的字体(XXX未初始化)出现。就目前小编主要看的也就这四种常见的问题。肯定是不全的,各位大神如有兴趣可以留言补充~
SAS hash对象是一种强大的数据步骤编程技术,它可以在内存中快速地存储和检索数据,实现表查找、合并、拼接和排序等操作。本文将介绍SAS hash对象的基本概念、优缺点、语法和应用,帮助SAS用户提高编程效率和性能。
DDE输出也是我最近get到的新技能,由于之前一直Tagsets输出Excel发现Tagsets输出有一些弊端,在数据量非常大的时候运行时间长,而且文件也会被放大。最近恰巧从朋友那儿看到了DDE输出相关的程序,然后就开始学习研究,目前也是一直半解,如有不当之处还望指正。
昨天哪一篇说了宏变量定义的三种方式(SAS-Macro 中的那些语句(一)),今天接着昨天的说...还是围绕着宏变量进行展开,第一个问题,宏变量的作用域有限制么?答案也是有的,和其它的编程语言中的变量是一样的,SAS中的宏变量是分局部宏变量与全局宏变量...
昨日,《药物临床试验数据递交指导原则》(试行)版正式公布了,在小编阅读后,于是本文因时而生了。
利用ods Excel输出的xlsx文件较小,怎么来形容其小呢,小编今天尝试了113个数据集(大概65M)利用ods excel输出到一个xlsx文件里面,文件大小只有586k.而利用tagsets.excelxp输出大小为10M。
3.再把路径搞一搞,主要有TFL程序放哪儿,输出的rtf放哪儿,程序日志放哪儿,其他路径用得着就搞,用不着就不管了,比如说公司有宏库要读取什么的,有其他的tool文件需要用的什么的。如果前期不知道这些要不要搞,那就不搞,大不了回来重新添加。
很早之前,小编打算分享一篇关于SAS实现花式表格的输出,后来诸事烦身就渐渐的忘记了这一茬。日前,有朋友问了我一个表格输出问题。小编觉得是一个很有意思的程序,于是就想分享给大家,SAS也可以制作结构复杂的报表!
今天要分享的小知识使用SAS自带的转化XPT(V8)的宏程序。法规要求使用V5及以上版本的XPT,所以V8版本也是适用的,相比来说V8可以不考虑字符长度超过200需要拆分的问题。
本项目中所有的公用变量如:项目编号,分组变量,唯一标识变量,本项目存在的文件夹位置,本项目用到的逻辑库,一些系统选项,或者外部数据导入,工具表的准备。创建的宏变量、路径、逻辑库、系统选项可以本项目使用,每一个项目有一个单独的Setup。下面对每一个作用进行详细解释:
嗯,于是小编从公众号上下载了自2017年11月11日-2018年03月25日的公众号每日增粉相关的数据...接着小编就开始分组了,以500人为区间,分成3个组进行对照研究(group1:<=1000;group2:1000-1500;group3:1501-2000);小编这里想到了临床试验中比较常见的对连续变量进行的描述性统计分析的一个例子,因此,我就套用过来对我公众号每日增粉数量进行分析,并按照临床试验中出三线表的形式,将分析结果进行输出!结果如下:
在知乎发现了几篇非常有意思的Unsafe 随堂小测[1],我来尝试解答一下。本文为第一篇。
在数据处理的工作中,可能会碰到要把汉字转换为对应拼音的问题,如将大量的中文姓名或名称转换成对应的拼音。之前写过一个简单的SAS程序来实现此目的,其主要步骤为:首先要用到汉字拼音对照表,然后将汉字设为宏变量,解析的值为其对应的拼音,接着将处理变量中的每个汉字前插入一个宏解析符号“&”,最后用RESOLVE函数在DATA步执行时解析得到对应的拼音,代码(SAS 9.2 for Windows)如下:
在SAS各种繁杂的PROC之后,还要来看看MACRO才可以嘛。又不能写函数... SAS中的MACRO:宏编写 MACRO主要是DO和%LET的各种组合,前者负责循环后者负责变量。 一个例子: image.png 这段代码可以做什么呢?很简单,替换文字。我们指定了一个SAS MACRO中的变量flowertype,在执行MACRO的时候他会被自动翻译成标准的SAS代码。这样执行的结果就是: 看到了吧,标题已经被替换了。 一段MACRO以%macro开始,然后以%mend结束。 image.pn
gcc 最开始的时候是 GNU C Compiler, 如你所知,就是一个c编译器。但是后来因为这个项目里边集成了更多其他不同语言的编译器,GCC就代表 the GNU Compiler Collection,所以表示一堆编译器的合集。 g++则是GCC的c++编译器。 现在你在编译代码时调用的gcc,已经不是当初那个c语言编译器了,更确切的说他是一个驱动程序,根据代码的后缀名来判断调用c编译器还是c++编译器 (g++)。比如你的代码后缀是*.c,他会调用c编译器还有linker去链接c的library。如果你的代码后缀是cpp, 他会调用g++编译器,当然library call也是c++版本的。 当然我说了这么多你可能感到有些混乱,没关系,你就把gcc当成c语言编译器,g++当成c++语言编译器用就是了。
这一篇推文是针对上一篇推文,进行SAS程序与功能上的完善!点击此处将可跳转至上一篇推文:SAS-如何简单快捷的实现RTF合并。在上一篇推文推送后,有不少人都对RTF的合并感兴趣,并找到了小编。于是小编决定将RTF的合并完善一下,写成宏程序,以便有需要的朋友可以直接使用。
最近在写一个宏(用来检查Define.xml中CRF页码是否与aCRF上的页码一致)的时候有用到单词边界(“\b”)这个定位符,在SAS在线文档中有其说明:\b matches a word boundary (the position between a word and a space),即“\b”匹配的是单词与空格之间的位置,这种表述其实是不准确的,文档的作者已经确认下一版会更新。比如“\b”匹配“_”与“*”之间的位置,而不匹配“_”与“_”之间的位置,所以正确的表述应该是“\b”匹配的是单词字符(\w)和非单词字符(\W)之间的位置。单词字符包括字母数字字符和下划线[a-zA-Z0-9_];非单词字符包括不为字母数字字符或下划线的任何字符。“\b”匹配单词边界,不匹配任何字符,是零宽度的;匹配的只是一个位置,这个位置的一侧是构成单词的字符,另一侧为非单词字符、字符串的开始或结束位置。“\b”一般应用需要匹配某一单词字符组成的字符串,但这一字符不能包含在同样由单词字符组成的更长的字符中。下面通过一个实例来简单的介绍一下这个元字符。
果然是不动脑筋久了就会变蠢,最近小编写程序感觉变蠢了许多。思来想去究其原因发现是公众号许久未更了。为了不让愚蠢延续下去,今天小编打算分享一些SAS编程相关的小技巧。
本系列【基础篇】已经完全完结了,方便大家阅读学习,我们合并在成一个专辑,目录如下: 1. SAS软件入门 2. 读取数据 3. 描述数据 4. ODS的使用 5. 开发数据(一) 6. 开发数据(二) 7. SAS宏初步 8. 相关、回归等基本统计 ---- 前言·数说君的话 在统计软件里,SAS算是一哥了,虽然R免费开源有各种统计函数、python功能多各方面比较平衡,但是、但是——SAS贵啊!正版的SAS一年要上百万,不是土豪用不起啊! 大家可以在前程无忧上分别搜索一下SAS、R和Python,对比一
聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准, 聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。 因此我们说聚类分析是一种探索性的分析方法。
上个月的今天,我从南到北,从深圳奔赴帝都参加了一个制药行业软件用户组2016中国区年会(PharmaSUG China 2016)。听了两天的报告,收获不少。有幸见到SAS绘图大神Sanjay Matange,可惜当时忘记了要合影。这个名字可能大家不熟悉,但是他的博客Graphically Speaking我相信很多人有看过。在众多报告中,印象较深的是这个。作者分享了几个很有用的SAS技巧,比如自动打开所标记的数据集、自动获取某个变量的值。可惜没有分享源程序,所以我写了三个小程序,实现了自动打开数据集、执行选中程序并打开生成的数据集以及复制变量值。
愉快的周末又要结束了,繁忙的周一也即将开始!小编今天给大家Share的一个Macro是关于临床数据清理中的一个实用性的Macro,SAS Edit Check Output Query. -- Setup
可以看出来,她作为一个AI模型,能够理解SAS,但是不能直接处理和分析数据。那我们看看她究竟能提供哪些帮助吧。
上一篇总结了一些入门的知识内容,本文结合个人经验,总结编程软件方面的内容,对各种软件在量化上的应用做一个对比,供参考。首先我的观点是,没有最好的软件,只有最适用的领域,先明确自己想做的是什么,再选择最合适的软件。这不是一篇广告文,也不是百度复制粘贴的结果。
上一篇cookie绕过验证码模拟登录博客园,但这只是第一步,一般登录后,还会有其它的操作,如发帖,评论等等,这时候如何保持会话呢?这里我以jenkins平台为例,给小伙伴们在沙场演练一下。
首先,咳咳,还是日常的开篇抱歉:由于最近大猫沉迷于Ingress无法自拔,所以原定于本期的data.table教程延后一期,咱们继续上次的系列《SAS or R:谁更适合你》,大猫来和小伙伴聊聊“开源”这件事。
如下代码,三个宏参数,inpath为需要转化后缀名SAS程序所在的路径,allYN控制是否将指定路径下所有SAS程序转化成TXT后缀(所有指的是包含指定路径下存在子文件夹),outencoding控制转化后TXT纯文本的编码。
不知不觉已是中秋了,感觉时间过的好快...2019已经过大半了...今年还有好多事没有做,深感内疚与自责!
说到Annotate Facility,首先要感谢我的同事Jason,是他让我认识了Annotate Facility。Jason不仅是个画图高手,他的统计更是强到”令人发指“!现简单地介绍一下Annotate Facility的基本信息,希望能给想要学Annotate的SASers一点帮助。
SQL中使用的符号 SQL中用作运算符等的字符表 符号表 每个符号的名称后跟其ASCII十进制代码值。 符号 名称和用法 [space] or [tab] 空白(制表符(9)或空格(32)):关键字、标识符和变量之间的一个或多个空白字符。 ! 感叹号(33):条件表达式中谓词之间的或逻辑运算符。用于WHERE子句、HAVING子句和其他地方。在SQL Shell中!命令用于发出ObjectScript命令行。 != 感叹号/等号:不等于比较条件。 " 引号(34):包含一个分隔的标识符名称。在动态SQL中
统计学与数据挖掘书籍推荐 1.1《 The Elements of Statistical Learning 》,神书,不解释 1.2《实用多元统计分析》,从线性代数的角度详细讲解算法,例子简单,国外课程教材 1.3《统计学习方法》,李航著,统计学习算法必备书籍 1.4《从零进阶!数据分析的统计基础》 CDA 数据分析师系列丛书 1.5《统计学:从数据到结论》 1.6《数据挖掘:概念与技术》 数据分析软件篇 SQL 书籍推荐 《 MySQL 必知必会》 SPSS 推荐书籍 《SPSS统计分析基
领取专属 10元无门槛券
手把手带您无忧上云