作者 CDA 数据分析师
SAS 作为世界知名大数据分析产品,只要是大机构, 不论是、制药、金融、保险、市场部门、NGO 还是政府部门,SAS 的覆盖率,都是完全不可被替代的。甚至部分IT公司在统计软件上,也选择的是 SAS。同时 SAS 系统具有使用灵活方便、功能齐全、编程能力强且简单易学、数据处理和统计分析融为一体、扩展性和适用性强及应用面广等优点。但是所有 SAS 入门选手都会遇到的问题是:
然后大多数人会因为无法安装而放弃掉。。。
SAS的基础模块分为:
1、BASE:即Foundation SAS。基础编程模块,主要功能为数据管理、统计分析、报表生成和图形展示。语法主要为DATA步和PROC步的操作。
2、STAT:统计模块,包含回归、方差分析、多元统计、非参数统计、抽样等数理统计操作。
3、SQL:SAS 中的结构化查询语言,与传统SQL完全相同,主要用作与数据查询,有数据库经验的人可以无缝对接,有些公司甚至使用SAS作为其底层数据仓库使用。
4、Enterprise Guide:可视化统计分析界面
5、Enterprise Miner:数据挖掘模块
6、Text Miner:文本挖掘
7、SAS/Hadoop SAS/Connect:使用各平台SAS系统进行分布式处理,从而有效利用各平台机器资源,与Hadoop的连接使其可以运行在大数据平台下。
……
关于EG,SAS EG和SAS Base的关系就像DOS和Windows的关系,都是把不易记忆的命令做成菜单,方便调用。要说明的是精通SAS必先要熟悉其结构及不断提高自己的编程能力,而作为新手,SAS EG提供的可视化界面以及同步代码记录可以为初学者学习SAS编程提供学习捷径。
当然,SAS是面向市场商业软件,为解决问题而生,它包括对问题的理解,对问题的抽象(有点像数学建模了),对问题进行解决,最后就是对结果进行分析而最终将其应用,以及不断改进。总之,SAS是解决问题的工具而已,要精通SAS,包括对问题的理解,对行业背景的熟悉。
① 《Little SAS Book A Primer Third Edition》
SAS入门的圣经,它通俗易懂,就算是英语不好的同学也不要害怕,它确实很容易懂得,记住要多看例子,多上机代码操作试试。
② 《Learning.SAS.by.Example.A.Programmers.Guide》
它类似little sas book,但讲得更详细和全面,也是一本入门的好书:
③不想看英文的可以看看下面这本:
《SAS编程技术教程》朱世武
入门了之后,有两块知识是非常重要的(在工作中会经常用到,而且是必须的):PROC SQL 和 Macro Facility。PROC SQL跟一般的SQL差不多,但是也有自己的特点和限制,它的作用跟data step类似,各有优点,用哪个就取决于个人的喜好的。要掌握PROC SQL,看看这本SAS的帮助文档,通俗易懂:
《SAS SQL Procedure:User's Guide》
学好SQL,还要掌握Macro。SAS Macro就像是高级语言的函数,帮你写重复类似的程序,大大提高了程序的效率,使得程序更容易维护,更容易模块化。在little sas book等入门书籍也涉及到macro,但远远不够,要全面理解和掌握macro,非看这本书不可:
《SAS Macro Programming Made Easy》
看完上面所有的书后,相信你的SAS编程能力已经不是入门级了。要想更进一步,就编程而言,就只能在学习和工作中不断实践,看一些进阶和商业方面的书籍。在这里,推荐两本教材:
① 《深入解析SAS》 ② 《SAS编程与数据挖掘商业案例》 话不多说,用了都说好。
当你熟悉了SAS的方方面面,就要回到原点。以上所有的教材,大多出自于SAS帮助文档:
SAS online document