首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

描述数据

输出数据集 可以用ODS OUTPUT语句为输出结果创立一个数据集(5.3),一些过程也可以用out=option。...下面的代码读取数据,计算新变量销售月份,month,并使用proc sort按照月份排序,并使用proc means的by语句来按照月份描述数据: ? 输出结果为: ?...; 这个语句之后可以用/option的形式添加选项,主要下面几个: LIST:用list形式打印交叉不是网格) MISSING:频率统计量包含缺失值 NOCOL:强制交叉不打印列百分比 NOROW...:强制交叉不打印行百分比 OUT=data-set:输出数据集 比如说,使用第二个选项: TABLESSex*YearsEducation/MISSING; 例子 有一家咖啡店的销售数据,记录了销售的咖啡种类...Missing选项也出现在了proc语句中,因此缺失值也会被考虑报告: ? 输出结果为: ? Region有三个变量值,第一个是missing缺失值。

3.7K101

【SAS Says】基础篇:8. 相关、回归等初步统计

SAS是一个专业的统计软件,前面我们介绍了很多数据管理、输出美化的东西,本节终于要介绍一点SAS做统计的知识了,不过,基础篇我们只大概介绍一下,更多统计分析的东西放在进阶篇。...输出结果在6讨论 8.6 读取proc reg的输出 Reg的输出有几个部分,方差分析和参数估计通常输出在一页。有些选项语句,比如plot,另外的页面中产生。...这部分的输出是由如下proc reg语句产生的结果: ? 第一部分是方差分析的结果,给出了模型对数据拟合的程度: ? 参数估计的结果如下: ?...结果将在8讨论: 8.8 读取proc anova的输出 Procanova的输出至少有两个部分,首先打印出有一个,给出分类变量的信息:水平数、变量值、观测值数。再次打印出变量表的分析。...第二部分是方差分析的: ? 因为模型是显著的,因此可以认为不是所有组的队员身高都相同。Means语句中的SCHEFFE选项比较了不同组的身高。 ?

2.2K60
您找到你想要的搜索结果了吗?
是的
没有找到

【SAS Says】基础篇:基本统计、相关分析与回归分析

输出美化的东西,本节终于要介绍一点SAS做统计的知识了,不过,基础篇我们只大概介绍一下,更多统计分析的东西放在进阶篇。...输出结果在6讨论 6. 读取proc reg的输出 Reg的输出有几个部分,方差分析和参数估计通常输出在一页。有些选项语句,比如plot,另外的页面中产生。...这部分的输出是由如下proc reg语句产生的结果: ? 第一部分是方差分析的结果,给出了模型对数据拟合的程度: ? 参数估计的结果如下: ?...参数分析的结果可以构建模型: Distance=-11.00859+2.89466*Height 下面的图形显示了plot语句的结果,如果有SAS/GRAPH模块,proc reg会描出数据点和回归线。...第二部分是方差分析的: ? 因为模型是显著的,因此可以认为不是所有组的队员身高都相同。Means语句中的SCHEFFE选项比较了不同组的身高。 ? 9.

3.4K50

【SAS Says】基础篇:ODS的使用(上)

你不可能总是SAS上查看结果,如果结果很多你要一一的讲结果复制到word中去,有ODS就好啦!它可以把SAS的结果直接输出到word、PDF等文件。...风格和模板 模板描述ODS如何制定数据格式并呈现数据。最普通的两个模板类型和是模板类型和风格模板类型。模板类型制定基本的输出结构,风格模板类型制定输出将如何呈现。...例子 下面代码对giant运行了proc means,并用ODS SELECT语句选择了第一个输出对象,mean: ? 输出结果为: ? 5.3 从过程输出创建SAS数据集 ?...,不是储存文件。...Adobe Acrobat输出结果如下,每一部分的输出结果在不同页面中出现: ? ?

9.7K72

【SAS Says】基础篇:描述性分析(上)

4.6 可供选择的formats() 4.7 使用proc format创建自己的格式 4.8 定制一个简单的报告 4.9 使用proc means描述数据 4.10 将描述性统计写入SAS数据集中...输出数据集 可以用ODS OUTPUT语句为输出结果创立一个数据集(5.3),一些过程也可以用out=option。...下面的代码读取并排序数据 ? 输出结果为: ? 因为SAS认为缺失值是比字符串和数值都小,所以排在了第一位。另外,由于whale shark 40的数据有两个,故因为nodupkey选项被删除一个。...下面的代码读取数据,计算新变量销售月份,month,并使用proc sort按照月份排序,并使用proc means的by语句来按照月份描述数据: ? 输出结果为: ?...前者5.3,后者的基本形式为: OUTPUTOUT=data-set output-statistic-list; Data-set是要储存结果数据集名,output-statistic-list则界定需要保存哪些统计量和名称

2.8K71

【SAS Says】基础篇:描述性分析(下)

4.15 proc tabulate输出的顶部 4.16 为proc tabulate的输出数据方格指定多种格式 4.17 用proc report产生一个简单的输出 4.18 proc report...; 这个语句之后可以用/option的形式添加选项,主要下面几个: LIST:用list形式打印交叉不是网格) MISSING:频率统计量包含缺失值 NOCOL:强制交叉不打印列百分比 NOROW...:强制交叉不打印行百分比 OUT=data-set:输出数据集 比如说,使用第二个选项: TABLESSex*YearsEducation/MISSING; 例子 有一家咖啡店的销售数据,记录了销售的咖啡种类...4.14 提升proc tabulate的输出外观 三种方式可以提升输出的外观: Format=option 可以改变数据的格式,比如,中使得数字有逗号,并不含小数,则使用: PROC TABULATE...Missing选项也出现在了proc语句中,因此缺失值也会被考虑报告: ? 输出结果为: ? Region有三个变量值,第一个是missing缺失值。

4K50

一文搞定SAS软件:①界面操作介绍

主要作用是显示运行程序后的有关信息。显示的信息内容包括所建立的数据集名称、建立数据集包括多少个变量和观测、执行了什么过程、执行过程运行了多长时间、语句中有什么错误等等。 ? 3、输出窗口 ?...主要作用是显示程序运行的结果。 注:当程序写好时需要点击运行(小人的图标哟),另外需要注意无论是数据集的名称还是SAS程序,SAS均不区分大小写。 ?...二、SAS数据集与SAS数据库 SAS数据集存放于SAS数据,类似于excel文档存放在一个文件夹。...七、描述性统计分析 数值型变量的均值(means 过程): 程序:proc means data=a1;var age;run; 结果如下: ?...可以限制means过程步的输出结果,如下需要输出age的n mean std stderr p5 cv。

3.5K20

一文搞定SAS软件做统计分析:①界面操作介绍

主要作用是显示运行程序后的有关信息。显示的信息内容包括所建立的数据集名称、建立数据集包括多少个变量和观测、执行了什么过程、执行过程运行了多长时间、语句中有什么错误等等。 ? 3、输出窗口 ?...主要作用是显示程序运行的结果。 注:当程序写好时需要点击运行(小人的图标哟),另外需要注意无论是数据集的名称还是SAS程序,SAS均不区分大小写。 ?...二、SAS数据集与SAS数据库 SAS数据集存放于SAS数据,类似于excel文档存放在一个文件夹。...七、描述性统计分析 数值型变量的均值(means 过程): 程序:proc means data=a1;var age;run; 结果如下: ?...可以限制means过程步的输出结果,如下需要输出age的n mean std stderr p5 cv。

2.2K10

【学习】七天搞定SAS(三):基本模块调用

PROC的基本内容:CONTENT 先是一个最基本的PROC:content,可以显示数据集的主要特性。...一般说来,我尽量变量命名的时候长一点,这样直接可以读懂;再就是重建一个新的,存储变量名和label。 SAS PROC求子集:WHERE 如果要在PROC里面先求子集的话,可以直接调用WHERE。...输出数据:PRINT 最简单的数据输出怕就是PRINT了,顾名思义,直接打印数据出来。...excel的数据透视和R的data.table的模块,就是MEANS。...我的感觉是,MEANS, TABULATE和REPORT这三个模块各有千秋,基本就是可以替代EXCEL的数据透视,虽然效率上说不好谁比谁高...随便哪一个用习惯了就好,反正又不是天天出政府报告的,我就懒得深究了

1.4K50

SAS or R:谁更适合你?(二)

绝大多数的经济学研究遇到的数据处理需求是I/O Intensive的,这由学科性质所决定:社会科学注定要搜集大量原始的“脏”数据并进行诸如删除缺失值、连接(Table Join)等各种I/O操作(你想想看你自己写代码的时候是不是把绝大部分时间花在这些事上了...如果用SAS,那么大猫首先需要用Proc Means来统计全国的均值,然后通过Output语句将结果输出,假设输出数据集是Means吧,然后大猫还得把数据Means给Join回原来的数据集,关键是Join...另外作为一个完美主义者,大猫希望每个数据集都能被优雅地、有意义地命名,但是看着那么多Proc Means输出数据集大猫真是想死的心都有了啊!该怎么命名啊!逼死强迫症啊!...原来,由于SAS语法处理有些数据的时候不是那么简洁,大猫是SQL语法和SAS语法混着用的(SAS调用SAS/ACCESS访问MySQL),现在,大猫处理数据已经全部换成了R。...和Robustness,但是毕竟我们的目标是学术探索,代码是我们思考的工具不是卖给别人的产品,因此我们需要有一种语法尽可能直观简介地表达我们的需求,不是某种运行更快但是冗长的语法,我们Coding

79320

【SAS Says】基础篇:1. SAS软件入门

变量和观测值 传统的SAS术语数据包括变量和观测值。采用相关的数据库的术语,SAS数据集也被叫做表、观测值也被叫做行、变量也被叫做列,你可以看到下面这个包含一些数据。 ?...过程步由proc语句开始:proc+过程名(print、sort、means…),SAS过程步可以处理从数据储存、输出到方差分析、3D图表的一切操作。...记住,这个不是proc语句永远不能创建SAS数据集,或者DATA语句永远不能够分析生成报告。 1.4 数据步的内置循环 Data步读取并修改数据,让你以灵活的方式控制处理数据。...提交SAS程序之后,任何的说明、错误、警告和程序语句都会显示日志窗口上。 输出窗口 如果程序产生需输出结果,那么会反映在在输出窗口中。...打印或保存部分输出 如果要打印结果窗口中显示的某一部分的输出,则需将鼠标移到该部分上,右击,选择打印或保存即可。或者点击一下,使其黑亮,再从菜单栏文件(file)的下拉菜单中选择输出保存

4.9K81

SAS用K-Means 聚类最优k值的选取和分析

K-Means是一种聚类算法,其主要目标是将相似的元素或数据点分组为一个聚类。 K-均值的“ K”代表簇数。 距离量度将确定两个元素之间的相似性,并将影响簇的形状。...; (4)重复步骤(2)、(3),直到聚类中心不再发生变化; (5)输出最终的聚类中心和k个簇划分; SAS的K-均值聚类 让我们来看一个著名的IRIS数据集。...使用proc检查数据集 /* 检查数据内容 */ proc means data=work.iris N Nmiss mean median max min; run; 它具有150个观测值和5个变量...但是,可以ccc图中对其进行交叉验证。 ? 从图中看到,聚类标准有15个值(如我们代码输出给出的= 15) ? 从上面的CCC图可以看出,肘部下降在3个聚类。因此,最佳群集将为3。...3)易于解释聚类结果。 4)计算成本方面快速高效。 缺点: 1)即使输入数据具有不同的簇大小,均匀效果使得结果经常会产生大小相对一致的簇。 2)不同密度的数据可能不适用于聚类。 3)对异常值敏感。

1.9K20

【学习】七天搞定SAS(三):基本模块调用(格式、计数、概要统计、排序等)(下)

SAS里面总结数据:MEANS SAS当然还有类似于excel的数据透视和R的data.table的模块,就是MEANS。...image.png 当然这些统计量也可以直接的写入一个SAS数据,只需要加上一个OUTPUT就可以了。...原数据: image.png 最终结果为: SAS PROC统计频率:FREQ 计数的话,就要靠SAS里面的FREQ模块了。...image.png 最终结果: 类似的,还可以增加统计量(类似于MEANS那里): image.png 可以得到: 最后还可以混合FORMAT等等,可以变得相当的复杂。...,MEANS, TABULATE和REPORT这三个模块各有千秋,基本就是可以替代EXCEL的数据透视,虽然效率上说不好谁比谁高...随便哪一个用习惯了就好,反正又不是天天出政府报告的,我就懒得深究了

1.8K60

ResNet压缩20倍,Facebook提出新型无监督模型压缩量化方法

相比较之前的量化方法,本文提出来一个向量量化方法,其主要思想是保存网络重建之后的输出不是原始无压缩网络的权重。本文提出的方法无需标注数据,并且使用对 CPU 推理友好的字节对齐码本。...图1:量化保存权重和本文方法的比较 图1,灰色线代表真实的分类器,红色线表示量化保存权重的标准方法训练得到的分类器,绿色线是本文提出的方法。...in-domain,可以看出,本文的方法可以比较好的拟合真实的分类器,标准方法为了拟合out-of-domin领域的数据in-domain反而带来了错误的分类。...需要注意的是,量化的过程,使用的是当前层的输出不是非压缩网络的输出值。因为,实验过程,使用非压缩网络的输出值会带来一定的误差。...论文总结和分析 本文作为一篇网络压缩方向的论文,从本质上提出来了独特的量化方法,其提出的保存输出结果不是保存权重的思想,从而可以拟合in-domain数据并且忽略out-of-domain的数据,这是很值得借鉴和思考的

1K30

【SAS Says】基础篇:SAS软件入门(上)

过程步由proc语句开始:proc+过程名(print、sort、means…),SAS过程步可以处理从数据储存、输出到方差分析、3D图表的一切操作。...记住,这个不是proc语句永远不能创建SAS数据集,或者DATA语句永远不能够分析生成报告。 1.4 数据步的内置循环 Data步读取并修改数据,让你以灵活的方式控制处理数据。...提交SAS程序之后,任何的说明、错误、警告和程序语句都会显示日志窗口上。 输出窗口 如果程序产生需输出结果,那么会反映在在输出窗口中。...结果窗口 结果窗口就像输出窗口的一个目录,以提纲形式列出了输出的每一个部分。 SAS命令 SAS命令是为了不同的任务,你有三种方式发出命令:菜单、工具栏、SAS命令栏,如下图: ?...如果你的程序产生了输出,那么结果窗口会显示这些输出的目录,下图是一个例子,显示了提交程序之后,增强型编辑窗口、日志窗口、结果窗口、输出窗口的样式。 ?

3.6K80

SAS-给公众号做一个秩和检验

就是结果中三线输出,三线输出小编以前虽然写过相关的推送,不过吧,现在水平又提升了一丁点!...看到上面的结果:是不是和前面RTF的排版结构相差很大呢,那是因为没有转置,接下来就来转置一下: proc transpose data=temp3 out=temp3_1 (rename=(_NAME...卡方检验结果输出!其实和上面的也是很类似,都整到数据集中,进行转置啊等几步数据结构的操作,这样就可以实现想要输出结构的排版,这里就不细说,直接贴代码了!...做到这一步,整个数据的操作基本上是完成了,接下来就是数据集的输出输出到RTF。这里小编就用了直接写好的宏进行输出。...tablename :title显示表格名称 inds:title的数据 tableid:对饮表格编号 ftyn:title 是否body ; /*Set output file name

1.4K20

SAS用梯度提升回归树(GBDT)迁移学习预测抵押贷款拖欠风险和垃圾电子邮件数据

1:房屋净值数据的变量 proc print data=myhmeq(obs=10); run; 显示了的前10个观察值。 图1:部分数据 图2:显示“模型信息”。...该表显示了前六行训练参数的值,以及有关增强模型树的一些基本信息。 图2:模型信息 GRADBOOST 图3显示“观察值数量”,该表显示读取和使用了多少观察值。...输出1.1:拟合统计信息,在运行时拟合 以下语句使用以前保存的模型对新数据评分: proc gradboost data=mil inmodel=mycst_model; output out=...在此示例,计分的数据与训练数据相同。 输出12.1.2:拟合统计,以后拟合 此示例说明,GRADBOOST过程可以使用先前保存的增强模型对输入数据进行评分,该模型 在先前的过程运行中保存 。...此示例不使用迁移学习的情况下运行了GRADBOOST两次:一次包含所有数据,一次不包含辅助观测。所有模型均使用目标人群的数据不是训练数据的一部分)进行评估。

42530

SAS-Sql的这些用法你都会了么?

SAS里面,有俩大步,一个data步,另外一个就是proc过程步,proc过程步数据结构的操作与筛选当属Proc sql过程步。...,SASproc sql其实就是类似数据库的查询语句。...来见一下:proc mean的写法: proc means data = raw.ds noprint; where dscompyn='1'; class Siteid; output out=temp3...在这里,有没有发现小编将where 写到need1后面,不是raw.dm后面。其实这个就是小编想说的,where语句的位置。有时候不同地方效果不是一样的。...不是明明select的时候创建了这些变量了么?这个问题的答案其实很简单,此处的where语句针对的raw.dm这个数据集进行的筛选,need2后面的where是针对need2数据集进行的筛选。

5.5K20
领券