首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

SAS - PROC SQL:如何使用PROC REG显示表中的预测值?

在SAS中,可以使用PROC SQL和PROC REG来显示表中的预测值。

首先,PROC SQL是SAS中用于执行结构化查询语言(SQL)的过程。它可以用于从数据集中选择、排序、过滤和汇总数据,以及执行其他SQL操作。PROC SQL提供了一种灵活且强大的方式来处理数据。

而PROC REG是SAS中用于执行线性回归分析的过程。它可以用于建立线性回归模型,评估模型的拟合程度,并进行预测。

要使用PROC REG显示表中的预测值,可以按照以下步骤进行操作:

  1. 首先,使用PROC SQL从数据集中选择需要进行回归分析的变量,并将结果存储在一个新的数据集中。例如,可以使用以下代码选择变量X和Y,并将结果存储在名为reg_data的数据集中:
代码语言:txt
复制
PROC SQL;
    SELECT X, Y
    INTO reg_data
    FROM your_table;
QUIT;
  1. 接下来,使用PROC REG对新的数据集进行回归分析,并生成预测值。可以使用以下代码执行简单线性回归分析,并将预测值存储在名为reg_output的数据集中:
代码语言:txt
复制
PROC REG data=reg_data;
    MODEL Y = X;
    OUTPUT OUT=reg_output PREDICTED=Y_pred;
RUN;

在上述代码中,data=reg_data指定了输入数据集,MODEL Y = X指定了回归模型,OUTPUT OUT=reg_output PREDICTED=Y_pred指定了输出数据集和预测值变量名。

  1. 最后,可以使用PROC SQL将预测值与原始数据集进行连接,以显示表中的预测值。例如,可以使用以下代码将预测值与原始数据集连接,并将结果存储在名为final_output的数据集中:
代码语言:txt
复制
PROC SQL;
    CREATE TABLE final_output AS
    SELECT a.*, b.Y_pred
    FROM your_table a
    LEFT JOIN reg_output b
    ON a.Y = b.Y;
QUIT;

在上述代码中,your_table是原始数据集的名称,Y是用于连接的变量,Y_pred是预测值变量。

通过以上步骤,可以使用PROC SQL和PROC REG来显示表中的预测值。这样可以方便地进行回归分析,并将预测值与原始数据集进行关联,以便进一步分析和应用。

关于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体品牌商,建议您参考腾讯云官方网站或咨询腾讯云客服获取相关信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

【SAS Says】基础篇:基本统计、相关分析与回归分析

使用proc reg做简单的回归分析 REG过程使用最小二乘法拟合线性回归模型,是SAS/STAT 产品的一部分。Reg使用逐步法、前进法、后退法进行自变量的筛选。...由于没有SAS/GRAPH模块不能产生回归线,需要用预测值代替观测值来拟合出线。...下面的代码显示了用reg过程产生数据的单个散点图和预测值: PROC REGLINEPRINTER; MODEL dependent=independent; PLOT dependent*independent...*independent='symbol'/OVERLAY; Symbol的值指定SAS使用哪种标记来标注数据点,如果不指定,SAS会直接使用数字。P.是代表预测值的关键词。...结果将在8中讨论: 8. 读取proc anova的输出 Procanova的输出至少有两个部分,首先打印出有一个表,给出分类变量的信息:水平数、变量值、观测值数。再次打印出变量表的分析。

3.9K50

【SAS Says】基础篇:8. 相关、回归等初步统计

8.5 使用proc reg做简单的回归分析 REG过程使用最小二乘法拟合线性回归模型,是SAS/STAT 产品的一部分。Reg使用逐步法、前进法、后退法进行自变量的筛选。...由于没有SAS/GRAPH模块不能产生回归线,需要用预测值代替观测值来拟合出线。...下面的代码显示了用reg过程产生数据的单个散点图和预测值: PROC REGLINEPRINTER; MODEL dependent=independent; PLOT dependent*independent...*independent='symbol'/OVERLAY; Symbol的值指定SAS使用哪种标记来标注数据点,如果不指定,SAS会直接使用数字。P.是代表预测值的关键词。...结果将在8中讨论: 8.8 读取proc anova的输出 Procanova的输出至少有两个部分,首先打印出有一个表,给出分类变量的信息:水平数、变量值、观测值数。再次打印出变量表的分析。

2.2K60
  • SAS语法入门介绍

    数据步中还可以使用input、infile、datalines等语句来读取外部文件或内嵌数据,以及使用array、do、output等语句来创建或处理数组和循环。...过程步的核心是proc语句,它用来调用SAS提供的各种过程,如proc print、proc freq、proc means、proc reg等,用来打印、统计、描述或回归分析数据集。...过程步中还可以使用title、footnote、ods等语句来添加标题、脚注或控制输出格式。...p=pred r=resid; * 输出预测值和残差到regout数据集; run; * 结束过程步; 总结 本文介绍了SAS语法入门介绍的公众号文章。...我们了解了SAS语言的基本结构和语法,以及如何使用数据步和过程步来处理和分析数据。SAS是一种强大而灵活的统计分析软件,它可以帮助我们解决各种实际问题。

    38110

    【学习】七天搞定SAS(七):常用统计模型

    SAS里面的PROC CORR提供了相应的功能。...image.png SAS的相关性分析结果输出如下: SAS里面的基本回归分析:PROC REG 类似于R中的lm(),这个实在是没什么好说的了,最基本的最小二乘法。...比如PROC REG的参数就有: Table 73.1 PROC REG Statement OptionsOptionDescriptionData Set OptionsDATA=names a data...然后是模型的基本统计: 最后是各个组的分析结果(两两比较,由于指定了SCHEFFE参数): SAS中的离散被解释变量模型:PROC LOGISTIC和PROC GENMOD 最简单的离散被解释变量模型就是...SAS里面的PROC一览 除了上面说到的PROC,SAS当然还有更多强大的模块。我就顺手一一点开看看这些东西都能做什么...

    5.3K80

    留一交叉验证及SAS代码

    (点击查看)中,我们总结过当数据量很少时如何选择模型和方法,以使得数据能够最大限度的得到利用。 其中有一个方法就是做交叉验证。...,得到一个测试结果(真实值与预测值的差异);再拿出另外9个进行训练,留下另外一个进行测试......如此验证10次(每个样本都能轮到一次验证样本),将10次的预测效果平均,就可以评价这个模型的好坏。...下面分享一下数说君留一交叉验证的SAS代码,样本量假设为30: *样本量30; %let K=30; *为数据增加一个变量:index,标识出观测值的ID(从1到30); data sample;...set sample; index = _n_; run; *用全30个样本建模看一下; proc reg data=sample; model y= x1 x2 x3; run;...sampleOut; set sampleOut; if selected then new_y=y; run; *计算selected=0的样本、也就是测试样本的预测值; proc reg

    1.4K60

    在SAS里玩穿越 | 【SAS Says·扩展篇】IML:穿越 | 数说·语言

    一直以来,大众了解的SAS都是数据集操作,使用的方法是数据步和过程步。但其实,SAS这个庞大的系统中还隐藏了另一个平行世界——IML,在这个世界里,你需要一个像操作MATLAB一样的矩阵思维。...今天我们将介绍如何在SAS里玩穿越,将数据从矩阵变成SAS数据集,从SAS数据集再变成矩阵。它将大大方便我们的使用。...第二个问题:如何把矩阵转换成数据集来处理? SAS的优势在于强大的统计模块,无论是回归、检验,还是数据管理SQL,甚至是贝叶斯,都可以方便快速的实现,因此,将矩阵转换成数据集来做统计分析,真好。...矩阵变成数据集之后,就可以用SAS的各种强大的统计模块做分析了。 好,第二个问题也就这么愉快的结束了! 第三个问题:直接在IML模块中处理数据集 首先我们也还是要使用use语句打开数据集。...这是Ansta给自己布置的作业,大家也可以试一试,再对照proc reg的结果看一下,之后会给出我自己修改的代码,我也是在学习,希望能和大家一起交流。

    2.3K60

    在SAS里玩穿越 | 【SAS Says·扩展篇】IML:5.穿越

    作业 | 编一个SAS回归软件 ---- 一直以来,大众了解的SAS都是数据集操作,使用的方法是数据步和过程步。...今天我们将介绍如何在SAS里玩穿越,将数据从矩阵变成SAS数据集,从SAS数据集再变成矩阵。它将大大方便我们的使用。...第二个问题:如何把矩阵转换成数据集来处理? SAS的优势在于强大的统计模块,无论是回归、检验,还是数据管理SQL,甚至是贝叶斯,都可以方便快速的实现,因此,将矩阵转换成数据集来做统计分析,真好。...矩阵变成数据集之后,就可以用SAS的各种强大的统计模块做分析了。 好,第二个问题也就这么愉快的结束了! 第三个问题:直接在IML模块中处理数据集 首先我们也还是要使用use语句打开数据集。...这是Ansta给自己布置的作业,大家也可以试一试,再对照proc reg的结果看一下,之后会给出我自己修改的代码,我也是在学习,希望能和大家一起交流~

    1.7K70

    SAS hash对象,提高编程效率和性能

    SAS hash对象是一种数据结构,它包含了一个数组,用于将一个或多个值与一个键(例如,员工ID)关联起来。SAS hash对象是在数据步骤中创建和使用的,不适用于任何SAS过程。...SAS hash对象也有一些缺点,主要在于以下方面: SAS hash对象需要明确的键来进行匹配,而PROC SQL可以使用各种操作符来进行条件连接。...因此,SAS hash对象不能处理一些复杂的连接逻辑,例如范围或模糊匹配。 SAS hash对象只能在数据步骤中使用,而PROC SQL可以在任何地方使用。...因此,在使用SAS hash对象之前,需要评估数据集的大小和可用内存的情况。 SAS hash对象如何使用?...使用defineDone方法来完成hash对象的定义 。 使用find方法来在hash对象中查找与当前数据步骤中的键变量相匹配的观测值 。 使用output方法来输出合并或拼接后的结果数据集 。

    68420

    【SAS Says】基础篇:描述性分析(下)

    好吧,这一节是留给处女座的,主要说如何用proc tabulate和proc report产生一个更加耐看的报告。...; 这个语句之后可以用/option的形式添加选项,主要下面几个: LIST:用list形式打印交叉表(而不是网格) MISSING:频率统计量中包含缺失值 NOCOL:强制在交叉表中不打印列百分比 NOROW...交叉表的每个小方格内,SAS打印了频数、百分比、行百分比和列百分比。左边和右边是累积百分比。注意计算频数时没有考虑缺失值。 ?...数值变量VS字符串变量 从proc report得到的报告类型,部分依据于使用的数值类型。只要报告中起码有一个字符串变量,默认的报告就是每个观测值一行。...选项 这个选项告诉SAS如何使用这个变量,可能的usage选项包括: Across:为变量的每一个变量值都创建一个列 Analysis:为变量创建统计量,数值变量默认有这个usage选项,且统计量默认为

    4.3K50

    SAS-编程中的小技巧(三)

    这又是一篇SAS编程中的小技巧,这次要说的是SAS中数据字典与Macro结合起来的使用技巧,以及数据集删除、保存等技巧.......这些表有一些小齿轮...这些表对于SAS很重要,SAS的很多属性,配置都是以表的形式储存下来...也就是储存在这样的表里面...红色部分圈起来的俩个表是比较常用的表...也是数据集字典的来源......那么为什么SAS的逻辑库名称不能超过8位的长度...大概是因为VTABLE这个表中逻辑库名称的那一列的变量长度定义的是8的原因吧...所有定义长度超过8的时候,逻辑库名称就写不进VTABLE那张表......快速删除数据集 经常,我们需要在SAS中删除一些数据集...那么如何删除数据集呢?删除的方法众多...来见见一些常见的方法......既然在PROC SQL中能创建数据,那么PROC SQL中能否删除数据集呢...是可以的。

    2.4K20

    【SAS Says】基础篇:3. 描述数据

    本节介绍如何利用SAS写一份数据报告,给出数据的基本信息。 从3.11开始的内容,是留给处女座的,主要说如何用proc tabulate和proc report产生一个更加耐看的报告。...3.6 可供选择的formats(表) 3.7 使用proc format创建自己的格式 3.8 定制一个简单的报告 3.9 使用proc means描述数据 3.10 将描述性统计写入SAS数据集中...3.7 使用proc format创建自己的格式 有时候变量值用数字代表实际的变量值,比如1代表男性,2代表女性,这种代码在打印的时候不好解读,可以用proc format使得打印出想要的值。...; 这个语句之后可以用/option的形式添加选项,主要下面几个: LIST:用list形式打印交叉表(而不是网格) MISSING:频率统计量中包含缺失值 NOCOL:强制在交叉表中不打印列百分比 NOROW...数值变量VS字符串变量 从proc report得到的报告类型,部分依据于使用的数值类型。只要报告中起码有一个字符串变量,默认的报告就是每个观测值一行。

    3.9K101

    【SAS Says】基础篇:4. ODS的使用

    并且,你还要在这些文件中定制字体、背景、颜色... 4.1 ODC的概念 4.2 追踪选择过程的输出 4.3 从过程输出中创建SAS数据集 4.4 使用ODS语句创建HTML输出 4.5 使用ODS语句创建...风格和表模板 模板描述ODS如何制定数据格式并呈现数据。最普通的两个模板类型和是表模板类型和风格模板类型。表模板类型制定基本的输出结构,而风格模板类型制定输出将如何呈现。...当ODS接受来自过程的的数据时,它将数据与表模板结合。对应的表模板和数据就叫做输出对象。如果使用by语句,SAS会为每一个BY组产生一个输出对象。...说明了表中的哪一部分将应用风格,style-attribute是要改变的风格属性,value是属性值。...4.10 使用style=option定制proc tabulate输出 下面显示了proc tabulate语句中可以应用style的地方,并且影响的表区域: ?

    4.6K123

    针对SAS用户:Python数据分析库pandas

    换句话说,DataFrame看起来很像SAS数据集(或关系表)。下表比较在SAS中发现的pandas组件。 ? 第6章,理解索引中详细地介绍DataFrame和Series索引。...5 rows × 27 columns OBS=n在SAS中确定用于输入的观察数。 PROC PRINT的输出在此处不显示。 下面的单元格显示的是范围按列的输出。...也要注意Python如何为数组选择浮点数(或向上转型)。 ? 并不是所有使用NaN的算数运算的结果是NaN。 ? 对比上面单元格中的Python程序,使用SAS计算数组元素的平均值如下。...PROC FREQ与自变量_CHARACTER_和_NUMERIC_一起使用,为每个变量类型生成频率列表。 由于为每个变量产生单独的输出,因此仅显示SAS输出的一部分。...PROC SQL SELECT INTO子句将变量col6的计算平均值存储到宏变量&col6_mean中。

    12.1K20

    【SAS Says】基础篇:ODS的使用(下)

    在描述性分析中,介绍过proc report、proc tabulated这几个语句,如何定制输出的结果?字体、背景、颜色?...说明了表中的哪一部分将应用风格,style-attribute是要改变的风格属性,value是属性值。...下面的语句告诉SAS,对于month的每一个值,为摘要使用红色背景,为总体报告摘要使用橙色背景: ? 例子 下面是不同的女子5000米滑冰奥运会金牌获得者的数据,变量依次为:姓名、国家、年份、金牌数。...5.10 使用style=option定制proc tabulate输出 下面显示了proc tabulate语句中可以应用style的地方,并且影响的表区域: ?...注意一行有四个观测值: ? Tabulate过程建立了一个表,以年份作为行,记录作为列。年份和N的顶部都通过设置为null将其消除。ODS语句创建了HTML文件,使用默认模板: ? 结果如下: ?

    2.3K40

    SAS学习--导入导出文件、拼表、数据集筛选

    前言 目前项目进行到中期,最近又学习了一些新的知识,例如sas拼表、导出文件、数据集筛选等,好记性不如烂笔头,记录下来有待后期回头查看,人生总是走在学习的道路上。...SAS 导出文件 SAS将数据集导出为文件有两种方法,一种使用PROC EXPORT,另外一种是使用DATA步 proc export PROC EXPORT DATA=DATA_SET OUTFILE...,使用WHERE关键字对指定的列的值进行条件筛选,例子如下: DATA STUDENT; SET STUDENT; WHERE AGE <= 10; RUN; KEEP关键字 KEEP关键字可以使数据集保留下你想要的字段...拼表 SAS 拼表过程十分简单,拼表意思就是表A和表B有共同的列,将表根据相同的列拼在一起,跟SQL中的left join和right join还有inner join是一个道理,在拼表之前需要将数据集根据公共的字段排序.../*PROC SORT 默认会根据第一个字段排序,然后第二个,第三个*/ RUN; /* NODUPKEY:关键字可以实现去重功能 DUPOUT=数据集名称:可以实现将重复的数据放在指定的数据集中

    3.2K30

    【SAS Says】基础篇:描述性分析(上)

    前面在我们介绍了如何开发数据——如何使用SAS的函数、如何用if-then语句、如何处理SAS烦人的日期格式、如何使用retain语句让SAS保存前一次变量的值,如何快捷列出SAS的变量名等等。...4.6 可供选择的formats(表) 4.7 使用proc format创建自己的格式 4.8 定制一个简单的报告 4.9 使用proc means描述数据 4.10 将描述性统计写入SAS数据集中...下面的代码告诉SAS对数据messy排序,并将排序后的数据存在neat中: PROC SORT DATA=messy OUT=neat; 选项nodupkey告诉SAS排序时删除重复值,比如: PROC...4.4 用proc print打印你的数据 基本形式:PROC PRINT; SAS默认打印最近使用的数据集,DATA=可以指定数据集: PROC PRINT DATA=data-set; SAS默认打印观测值数...4.7 使用proc format创建自己的格式 有时候变量值用数字代表实际的变量值,比如1代表男性,2代表女性,这种代码在打印的时候不好解读,可以用proc format使得打印出想要的值。

    2.9K71

    SAS分类决策树预测贷款申请评分剪枝和结果可视化

    其他变量是模型的预测变量。以下语句将数据加载到会话中并显示数据表的前 10 个观察值。...因为没有包含 GROW 语句,所以 PROC TREEPLIT 默认使用熵度量,它计算增长树的增益。这 PRUNE 语句要求进行成本复杂性修剪。...叶节点中的第一个条形显示与训练分区中=0 或 =1Bad的预测相匹配的因变量的比例, 叶节点中的第二个条形显示与验证分区中匹配的因变量的比例。线的粗细表示哪些节点具有更多的总观测值。...创建评分代码并对新数据进行预测评分 除了查看有关树模型的信息之外,您可能有兴趣应用该模型来预测因变量未知的其他数据表中的因变量。您可以运行 SAS DATA 步代码对新数据进行评分。...该变量 IAD 表示观测值的 BAD 预测值。 您可以使用前面的语句对新数据进行评分,方法是在 SET 语句中包含新数据表 。

    64730

    【SAS Says】基础篇:SAS软件入门(上)

    变量和观测值 在传统的SAS术语中,数据包括变量和观测值。采用相关的数据库的术语,SAS数据集也被叫做表、观测值也被叫做行、变量也被叫做列,你可以看到下面这个包含一些数据的表。 ?...在上面这个表中,姓名是字符变量,身高和体重是数值变量,ID,既可能是数值有可能是字符,依据你的选择。 缺失值 数据有时会有些不完美,某些变量的个别观测值会缺失。...下表是data语句和proc语句的一些基本不同点: ? 这只是一个简化表,SAS软件非常灵活,所以data语句和proc语句之间真正的区别也是很模糊的。...从run运行的下拉菜单中选择submit提交 ? ? 上图显示了如何在windows视窗中提交增强型编辑窗口的程序。...访问SAS日志和输出 提交程序后,日志窗口和输出窗口会有相应的日志和结果显示,如果你使用的是增强型编辑窗口,之前的程序会保留,如果使用的是程序编辑窗口,之前的程序不会保留。

    3.8K80
    领券