SAS合并具有相同数据的多个列_合并具有相同值的两列的数据_SAS合并具有相同变量名称的两个数据集 - 腾讯云开发者社区

r、sas

过去，我在R中使用了优秀的SAScii包来读取这种类型的数据：{.dat固定列数据文件+相应的.sas“语法”文件}。我想对此非常精确，因为像"SAS文件“这样的短语是没有歧义的。这些.dat文件只包含整数，.sas文件指定了解析列的方式和整数在实际数据中表示值的方式(这个特性有时被称为“代码本”)。我从明尼苏达州人口中心的IPUMS .dat 这样的地方找到了非常好的数据格式(即文件对{.sas，.sas})，并建立了许多工具来使用R和SAScii来分析它。现在我可以访问SAS本身，但仍然希望重用我的一些工具和技术。但是，我在SAS中找不到类似于.dat中的{固定列数据、.sas}

浏览 2提问于2014-05-01得票数 1

2回答

将sas数据导入hadoop

hadoop、sas

我们正在购买第三方调查数据。他们以SAS格式向我们提供数据。源数据格式- SAS频率-每日数据-完整的一年数据集(无增量) 我们希望每天将这些数据带到我们的Hadoop环境中。我们有什么选择。我们要求他们以文本文件的形式发送数据。但是他们的文本文件有8650列(例如，国家..所以他们有250列-每个国家一列)。我们的ETL工具无法处理那么多列。根据它们，以SAS格式读取数据将变得更加容易。任何建议.. Thx

浏览 0提问于2014-04-09得票数 1

2回答

合并指定列顺序

sas

我有两个类似于此的SAS数据集： DATAONE DATATWO ----------- ------------------ ID A C E ID B D F 1 x x x 1 x x x 2 x x x 2 x x x 3 x x x 3 x x x 它们具有相同的长度，行向，并且在每一列中ID有相同的排序值。最初，为了组合数据，我使用了以下简单的一对一合并语句： data COMBINED; me

浏览 3提问于2014-03-24得票数 1

回答已采纳

1回答

带有条件的SQL中的SAS合并转换

sql-server、sas

我正在尝试将下面的SAS合并代码转换为SQL，对我来说，这是第一次将SAS脚本转换为SQL。 merge tb208; proc sort data=tb208; by rsn_cde; run; proc sort data=dclhcl; by rsn_cde; run; data dclhcl; merge tb208 (in=t) dclhcl (in=d); by rsn_cde; if d; run; 我在SQL中对上述合并的转换 SELECT t.* ,d.* FROM tb208 t JOIN dclhcl d ON t.rsn_

浏览 3提问于2022-09-05得票数 0

2回答

使用read_sas高效地将SAS导入R循环，要导入的列因文件而异

r、import、sas

尝试使用read_sas将一个文件夹中的一些SAS文件导入到R中，文件名符合模式"medpar20XX"，(XX = 00,01，....,16)。此外，还需要一个特定的列列表。我使用了for循环，但只成功导入了最后一个SAS数据文件(根据循环增量指示器)，并且所有产生的R数据帧都是这个最后的数据文件。下面是获取文件夹中符合文件名模式的文件列表的代码 patt = "medpar[0-9]{4}[[:punct:]]sas7bdat" file_list <- list.files(path="E:/Data/Bell_Disasters"

浏览 1提问于2019-08-16得票数 0

1回答

pandas.read_sas可以加载SAS列标签

python、pandas

我想将一个SAS7BDAT文件加载到pandas数据帧中，然后加载到数据库中。我知道允许加载SAS7BDAT，但我也想检索SAS列标签并将其存储在数据库中。(注意--这与列名不同，通常是列的详细文本描述)。是否可以使用Pandas为每一列加载SAS文本标签？

浏览 0提问于2017-04-04得票数 1

3回答

列表中条件的SAS数据步骤

sql、sas、where-clause、datastep

我尝试使用SAS中的数据步骤来筛选数据在列表中的位置。 proc sql; create table id_list as select distinct id from customer; quit; data test; set fulldata; where id in id_list; run; 它不起作用。但是，如果我使用"where in (1,2,3)“，它可以工作。有人能帮我把数据列在哪里吗？谢谢

浏览 7提问于2022-11-18得票数 1

回答已采纳

1回答

在sas中映射列名

sas、compare、two-columns

我有两张桌子我需要比较这两张表如果列数据相同然后映射列名table1。employee (map) table2.employee 因为它们中的数据是相同的如何在SAS中实现此功能？

浏览 38提问于2016-04-29得票数 0

1回答

简单地合并四倍的观察值

r、merge

事实证明我不应该相信我的数据来源。他们留下了重复的观察结果，并且没有像我想象的那样清理数据。所以这个问题是没有意义的。我正在尝试合并两个数据帧。我在过去已经做过很多次了，并且取得了很大的成功(在剔除打字错误之后)。我一直在用这个把头撞到墙上。我找不到问题所在。一个文件只有6列，其中4列在较大的文件中重复。我需要合并这4列的独特组合。例如，2014年场地X的横断面A处的植物1应该只有1行。每个横断面和场地都有指定给每个植物的唯一前缀，但我需要在以后通过这4列进行子集，所以我想维护它们。我尝试过cbind()和merge()。在merge中，我还使用了all=true或false，因为我知道

浏览 8提问于2019-06-11得票数 0

2回答

合并R中的数据集

r、merge

在R中合并2个data.frames时，我遇到了一个小问题。我正在尝试合并具有相同列名的2个data.frames，我希望R将相同名称的列合并为一个列，而不是使其成为两个单独的列。通常，当R在合并data.frames时遇到相同的名称列时，它会创建两个后缀为"x“和"y”的独立变量。有没有办法在合并命令中指定这一点，以便将不同数据集中的相似名称列视为一个列/变量？下面是我们可以用作示例的代码： x = data.frame(id = c("a","c","d","g"), mat

浏览 1提问于2013-07-17得票数 0

1回答

从SAS数据集中提取子数据&应用于不同的数据集

sas、sas-macro

我编写了一个宏来使用proc univariate为dataset (例如dsn1) %cust_quants(dsn= , varlist= , quant_list= )中的变量计算自定义分位数。输出是一个摘要数据集(例如dsn2)，其外观如下所示： q_1 q_2.5 q_50 q_80 q_97.5 q_99 var_name 1 2.5 50 80 97.5 99 ex_var_1_100 -2 10 25

浏览 0提问于2013-03-27得票数 0

3回答

如何在SAS中执行两个数据集之间的列绑定？

r、sas

我有两个数据集，包含相同的行数。我希望对这两个数据集执行列绑定，以创建第三个数据集。我们如何在SAS中执行此操作？这可以在R中使用cbind()来完成，在SAS中有等效的吗？

浏览 5提问于2015-02-09得票数 4

回答已采纳

1回答

在SAS中追加数据并在数据已经存在时进行覆盖

sas

我正在编写一个宏作业，它将数据集附加到现有的数据集(宏参数是日期)。如果该日期存在，我希望覆盖所有这些日期的数据。解决这个问题的最好方法是什么？如果是在SQL中，我将删除插入它们的行。有些SQL语言允许您在声明键时执行替换操作。我应该把类似的理论应用于SAS吗？

浏览 2提问于2015-02-16得票数 2

回答已采纳

1回答

就数据操作而言，业务对象领域的限制是什么？

sql、sas、business-objects

我被要求参与将大量报告从SAS迁移到Business。现有的SAS报表都使用Base代码查询事务性数据库；尽管它们被称为报表，但实际上包含了大量的数据操作。虽然我从未使用过Business，但我知道宇宙能够应用简单的映射(例如，为字段指定不同的名称)、转换(例如连接字段，或者执行求和或平均值)，并且能够连接表。问题是:数据操作在宇宙中能有多广泛？我是否能够模拟使用复杂SQL或多个临时表作为长计算或过程逻辑中的跳板的SAS代码？在什么时候，我需要使用ETL工具来进行这些操作，并在数据库中创建一个底层的“报告层”？

浏览 4提问于2013-09-12得票数 1

回答已采纳

1回答

如何从SAS表加载器更新postgreSQL自动增量字段

postgresql、sas、etl

我是SAS和PostGreSQL的新手，我目前正在努力将SAS数据迁移到PostGreSQL。当我试图将数据插入到PostGreSQL中时遇到了问题，在该表中有一个自动增量列"Id“。我使用SAS，创建节点SourceTable ->提取->表加载器-> TargetTable。我忽略map TagetTable.Id，因为这是一个自动增量列。我有错误说Id不能是空然后我尝试在Id表达式下使用NextVal("Id")，得到了错误的“函数NEXTVAL无法定位”。我试图将SAS中的"Is Nullable“设置为"Id”的true，

浏览 8提问于2022-06-01得票数 0

3回答

pandas合并产生重复的列

pandas、merge、duplicates

n1 = DataFrame({'zhanghui':[1,2,3,4] , 'wudi':[17,'gx',356,23] ,'sas'[234,51,354,123] }) n2 = DataFrame({'zhanghui_x':[1,2,3,5] , 'wudi':[17,23,'sd',23] ,'wudi_x':[17,23,'x356',23] ,'wudi_y':[17,23,'y356',23] ,&

浏览 4提问于2017-06-13得票数 0

1回答

SAS模糊查找

sas、lookup、fuzzy

我正在尝试对SAS中的两个数据集进行模糊查找。我在google上搜索了一下，找到了下面的链接，它解释了在SAS中进行模糊查找的过程。链接：为了详细解释这个问题，这两个数据集包含医院名称信息和其他附加信息。我必须匹配两个基于医院名称的数据集。但主要的挑战是，在某些情况下，我知道医院的名称如下： Dataset1(医院名称)：St.Hospital Dataset2(医院名称)：Saint.Hospital 比如wise公司和Incorporated公司。我想知道有没有在SAS中进行模糊查找的最好方法。谢谢，主播

浏览 6提问于2017-06-13得票数 0

2回答

如何在使用pandas.read_sas()时保留列的数据类型？

python、pandas、csv

当从读取到熊猫数据时，所有的列类型都被转换为(列类型没有保留)。下面是Python代码： import os import pandas as pd data_dir = os.getcwd() sas_file = os.path.join(data_dir, 'airline.sas7bdat') iter_sas = pd.read_sas(sas_file, iterator=True, chunksize=1000) for chunk in iter_sas: print(chunk.head()) 输出以下内容： YEAR

浏览 0提问于2018-06-23得票数 0

3回答

使用MODIFY添加列是SAS (无sql)

sas

我是SAS的新手，在使用MODIFY语句(不使用proc sql)向SAS中的现有数据集添加列时遇到一些问题。假设我有这样的数据 id name salary perks 1 John 2000 50 2 Mary 3000 120 我需要的是一个新的列，其中包含工资和津贴的总和。我试着这样做 data data1; modify data1; money=salary+perks; run; 但显然它不起作用。如果有任何帮助，我将不胜感激！

浏览 0提问于2016-11-20得票数 0

2回答

如何在分区中使用DO循环

arrays、loops、sas

我有一个数据集有3列-‘帐户’，'num_owners‘和’日期‘-顺序’帐户‘，然后’日期‘。对于每个帐户，如果num_owners中有更改(向上或向下)，则使用SAS循环进行标记： DATA test ; SET work.Owners_Change ; LENGTH change $20. ; RETAIN change ' ' ; ARRAY A[1] num_owners ; DO i=1 TO DIM(A) ; IF A[i+1] = A[i] THEN change = 'no

浏览 4提问于2021-06-23得票数 0

回答已采纳

1回答

如何在数据库中插入所有这些详细信息

php、javascript、mysql

我有一个应用程序，用户可以在其中编写一些问题，并将其添加到应用程序的表行中(每个问题进入每一行)。在用户写完问题后，他们可以将这些问题添加到数据库中。现在，如果用户只有一个问题要添加到数据库中，那么这是很好的，因为当我在数据库中插入此问题时，它会将问题插入数据库中。但问题是，如果用户有2个或更多的问题要插入数据库中，它只在数据库行中插入最新的问题，而不是两个问题。例如，如果我在应用程序表行中有一个问题(什么是2+2)，那么它将在数据库中显示下面的内容： SessionId QuestionContent SAS What is 2+2 但是，如果我在应用程序表行

浏览 0提问于2012-04-02得票数 0

回答已采纳

1回答

创建一个接受数据集作为输入和输出的SAS函数

function、input、dataset、sas、output

我正在对多个数据集进行相同的10个子步骤转换。让我们将此转换称为flag_price_change。此转换以数据集和阈值(real)作为输入，并创建10个子数据集，以便生成最后一个添加了一些列的子数据集。如前所述，我重复此转换为多个数据集。由于我正在以相同的方式处理多个数据表，我想知道是否可以在SAS中创建这样的函数。 flag_price_change(input_table,column_name1,column_name2,threshold,output_table). 其中，column_name 1和2只是算法关注的列的名称，output_table应该是在执行flag_pri

浏览 0提问于2014-02-06得票数 1

回答已采纳

1回答

如何在Hadoop中通过sql将联合与多个表结合使用？

sql、hadoop、sas、union

我正在尝试在Hadoop中‘联合所有’SAS中的多个表(使用sql)。我在联合所有上找到了线程，并能够让它在我的本地sas用户中运行，但是输出太大，SAS崩溃，所以我必须将我想要联合的数据集放在Hadoop中，然后再联合它们。这就是我在语法上有问题的地方。代码如下。我通常使用代码的开头和结尾部分来连接到Hadoop。 Proc SQL noerrorstop; Connect to HADOOP (server='X' port=X); Execute (set X) by HADOOP; Execute (drop Table X.CV_All) by HADOOP;

浏览 0提问于2018-04-01得票数 0

1回答

SAS: proc导入，其中get_names位于可变行

excel、import、sas

我有一个excel电子表格，其中前5列的列名在第2行，其他列的列名在第3行。数据将为第4行的每一列启动。如何用适当的名称在SAS中有效地加载这些数据？谢谢!

浏览 14提问于2014-09-02得票数 0

回答已采纳

1回答

无法生成同一表两次

opentbs、tinybutstrong

我今天遇到了一个奇怪的错误，您似乎不能在文档中使用相同数据的2次(或更多)相同的表。下面的屏幕截图使用以下数据： $first_event = [ "first_date" => "22/06/2018", "last_date" => "22/06/2018" ]; $second_event = [ "first_date" => "22/06/2018", "last_date" => "22/06/2018&#

浏览 0提问于2018-06-25得票数 0

回答已采纳

1回答

将UTF 8字符串从SAS写入MySQL

mysql、utf-8、sas

我将字符串从JSON文件导入到临时SAS表(SAS9.4M7)中，然后将它们写入一个永久的MySQL表( Linux上的MySQL社区服务器，8.0.12)。SAS表被设置为UTF-8，MySQL表使用"utf8_general_ci“作为表排序规则(在列级上与相关列相同)。导入到SAS工作正常，没有任何问题。但是，当我执行写入MySQL表的SAS代码时，某些行会导致错误："Execute error: Invalid utf8 character string:“ 似乎导致此错误的字符在SAS中显示为替换字符(带问号的黑色菱形)。一个实例是欧元符号( euro )，它在JSO

浏览 3提问于2021-07-14得票数 0

1回答

用循环中的字符替换对象名

我是SAS的R新手。我会在SAS中使用一个全局宏变量来实现这一点，但在R中还没有找到方法。我想知道如何使用循环或其他R功能，通过替换对象名称，即字符，并将名称附加到额外的文本('.sum')来简化代码。如果我从下面的代码开始： RED.sum <- aggregate(y ~ x, data = RED, FUN = "mean") ORANGE.sum <- aggregate(y ~ x, data = ORANGE, FUN = "mean") YELLOW.sum <- aggregate(y ~ x, data = Y

浏览 22提问于2017-01-19得票数 1

回答已采纳

2回答

SAS -如何根据条件选择随机样本

sas、sampling

我有一个SAS数据集，其中包含从-2000到4000之间的一列数字。我想根据以下条件选择37个随机样本。如果从-2000到-1000之间随机选择10个样本，如果是在-1000到0时随机选择15个样本，如果在0到1000之间随机选择12个样本，我试过以下几种方法： proc surveyselect data=save.table method=srs n=37 out=save.table_sample seed=1953; run; 但这将给我随机37个样本，从所有的人群。我想根据数据范围随机选择。请帮助使用SAS代码，非常感谢提前！

浏览 0提问于2019-07-11得票数 1

回答已采纳

2回答

将文件读取并附加到spark数据文件中

pyspark

我已经创建了一个空的dataframe，并开始添加它，通过读取每个文件。但其中一个文件的列数比前一个文件多。如何仅为所有其他文件选择第一个文件中的列？ from pyspark.sql import SparkSession from pyspark.sql import SQLContext from pyspark.sql.types import StructType import os, glob spark = SparkSession.builder.\ config("spark.jars.packages","saurf

浏览 1提问于2019-09-06得票数 3

回答已采纳

3回答

筛选SAS数据集以仅包含列表中给定的标识符

sas、proc-sql

我在中工作，并有一个包含唯一标识符(id_list)的列SAS表。我想过滤另一个SAS表，以只包含可以在id_list中找到的观察。到目前为止我的代码是： proc sql noprint; CREATE TABLE test AS SELECT * FROM data_sample WHERE id IN id_list quit; 这段代码给出了以下错误： Error 22-322: Syntax error, expecting on of the following: (, SELECT. 我做错了什么？谢谢你的帮忙。

浏览 5提问于2017-02-20得票数 1

回答已采纳

1回答

Python和SAS生成具有相同abs的PCA数据。价值只是倒转的迹象--为什么？

python、sas、pca

我正在构建一个Python 3(熊猫用于数据操作，numpy用于PCA通过SVD)，以模仿我在研究生院编写的一些代码。该代码在SAS 9.4中，使用PROC IML调用光谱矩阵上的svd。SAS代码： data Raman1; infile "Combined SpectraC.csv" dsd firstobs=2; input Wavenumber R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 R16 R17 R18 R19 R20 R21; run; proc iml; use Raman1; read all va

浏览 2提问于2020-04-29得票数 0

回答已采纳

1回答

是否可以将两个表合并为一个，并从两个数据集中创建一个枢轴表？

excel、pivot-table

有些尴尬的要求，所以我道歉，如果解释不太清楚。我有两个表，具有非常相似的数据(尽管不是完全相同的)，我想将它们合并在一起，并按如下所示进行汇总。这两个表都包含以下标题:发票、日期、帐户、编号、说明、空白、信用证、借方、总计然而，它们的意义略有不同(确切地说，是支持和委托)。这两个表都包含不同客户的多行数据，但有些客户可能只在一个表中。我对每个表分别使用了枢轴表来显示每个客户的总和(因此，我有一个包含每个客户总支持值的表，以及一个针对每个客户总佣金的单独表)。尽管如此，客户可能在一个枢轴表中，而不是在另一个枢轴表中。我想要的是一个表来显示两个表中的每个客户(如果他们都在两个表中，我只想

浏览 1提问于2015-12-15得票数 1

回答已采纳

2回答

sas中的双向查找

python、sas

假设我有一个(9000x9000)表，如下所示： zone 304 305 306 307 308 ... 001 1 2 8 9 12 ... 002 6 8 3 7 1 ... 003 4 8 1 12 9 ... 004 2 7 3 16 34 ... ... 主数据表如下所示： package # weight origin destination zone 123 2oz 004

浏览 2提问于2018-04-10得票数 0

1回答

(SAS)带有原始变量的Proc HPBIN输出

sas

在SAS，Proc HPBIN中，OUTPUT选项不保留原始变量，如下所述 output = SAS - data以单机模式创建一个输出SAS数据集，或者创建一个数据库表，该表与分布式数据库一起以分布式模式保存。输出数据集或表包含绑定变量。为了避免大数据集的数据重复，输入数据集中的变量不包括在输出数据集中。 ->如何保存原始变量和bin号？

浏览 6提问于2020-02-20得票数 0

3回答

sas :对一列进行排序，而不更改其他列的顺序

sorting、sas

我想知道我们是否可以在sas中对一列进行排序，并对其他变量保持相同的顺序。通常，我们用 proc排序使用"by“，但这将根据"by”中使用的变量更改所有变量的顺序。谢谢你的帮助

浏览 5提问于2016-03-18得票数 0

回答已采纳

1回答

使用Python将SQL输出读入SAS数据集时发出

python、pandas、encoding、sas

我正在尝试读取SQL查询输出，并使用Python熊猫创建一个SAS数据集。由于数据转移，我的SQL查询正在正确执行，但只将列名导入SAS数据集。这是一个编码问题，我想要一些关于如何解决这个问题的指导。下面是我的代码： with open ('Query.sql', mode = 'r', encoding='utf-8-sig') as sql_input: sql_input = sql_input.read() My_string = str('mssql+pyodbc://USER:Pass' + server +

浏览 6提问于2021-01-19得票数 0

回答已采纳

1回答

使用三列比较两个数据格式

python、pandas

我得到了两个数据；df_users，如下所示 df1如下所示我需要创建名为df2的第三个数据，在该数据中，我将使用三列“InterfaceDesc TESVLAN”从df_users中的USER_NAME列中获取相应的用户名我尝试使用merge、concat和datacompy比较函数，但都失败了，出现了不同的错误。请支持

浏览 2提问于2022-05-19得票数 0

3回答

使用proc import sas指定格式

import、sas、format、dataset、proc

我正在尝试从.txt文件导入一些数据到WPS (它与SAS语言一起工作)。每件事都运行得很好，直到我意识到对于一个列/变量，我的一些观察结果被删除了。例如，在列/变量类型中，我在原始文件中的5个第一个观察结果是： RAN FG MAJOFG ARBA ARBV RAN FG MAJ ARB ARB 因此，我考虑在导入过程中使用一种格式，使sas始终采用$8.格式。它可以与proc import一起工作吗？下面是我的代码： proc import out = sasuser.frais datafile="~/NAS/M/XXX.txt" dbms=dlm replac

浏览 5提问于2018-06-12得票数 1

2回答

SAS将字符/数字转换为数字

sas

我正在寻找一种方法来将字符转换成SAS中的数字，以便我可以使用max函数。此外，如果保留字符和数字，这将是有帮助的。下面是SAS表中列的数据列表。列UNK abc20140714 abc20140714x abc20140714xyz 123_abc20140714_xyz abc20150718 从列中去掉数字值后，我将对数据进行分组，并使用SAS中的max函数，该函数只应生成值20150718。为了避免任何混淆，我的问题是，有没有办法去掉非数字值，然后将该列转换为数字列，以便我可以使用max函数？谢谢。

浏览 4提问于2014-07-30得票数 1

回答已采纳

3回答

SAS合并重复观测值

sas

我有两个数据集(d1和d2)，我希望基于单个特定标识符(ind_ID)合并它们。问题是，在某些情况下，相同的ind_ID在一个或两个数据集中出现两次(其他字段不同)。我在d1中选择一个副本来与d2中的两个副本合并，但是我不确定如何告诉SAS只选择d1中的一个观测值，并将其合并到d2中的两个副本。我之所以这样做，是因为我还没有被告知哪个观察结果是正确的，我想继续我的编码，直到信息进来。到目前为止，我已经尝试了仅基于贷款号(第一个示例代码)和使用合并标识符(第二个示例代码)进行合并。似乎两者都有相同的结果，SAS只是随机地从副本中选择要与哪个ind_ID合并。除了手动浏览数据并删除我不想合并

浏览 1提问于2014-05-04得票数 1

2回答

将数据加载到Redshift后，Redshift表不会保留SAS排序顺序

sorting、sas、amazon-redshift、columnsorting

当我使用PROC SORT into Redshift加载按关键字(包含重复关键字)排序的SAS数据集时，Redshift中不会保留相同的排序顺序。例如。当我比较SAS数据集和Redshift表时，它们的排序顺序不同，数据在重复键中非常混乱，很难找到数据如何存储在Redshift列中的模式，或者为什么会发生这种情况。 ? ]1 任何关于在数据从SAS加载到Redshift后保持相同排序的建议或指导都将非常有帮助。谢谢！使用的代码： PROC APPEND BASE = Target_Table (bulkload=yes bl_compress=yes bl_bucket='x

浏览 36提问于2021-02-12得票数 0

回答已采纳

2回答

如何使用CSV中定义的关系将大型数据集导入Neo4j

neo4j、cypher

问题:如何有效地将大约8 GB的以下格式的数据加载到Neo4j中。我使用的是DocGraph数据集，它显示了医疗保险提供者之间的关系。数据集是一个包含以下列的csv： From_ID、To_ID、Count_Patients、Count_Transacts、Avg_Wait、Stdv_Wait From_ID指的是转诊医生的ID。To_ID是接受推荐的医生。最后四列是关系属性。第一列或第二列中的任何ID都可以在这两列中重新出现，因为提供者在这两个方向上都可以有许多关系。下面是我想出的基本查询(对Cypher来说非常新，但对SQL很在行)： LOAD CSV FROM "url"

浏览 3提问于2020-01-31得票数 1

3回答

在SAS上，合并、追加和合并有什么区别？

sas

我试图在SAS上运行代码来连接、追加和合并，但无法理解它们之间的区别。寻找一些人来帮助我理解同样的例子。

浏览 3提问于2016-03-23得票数 0

2回答

根据辅助数据集中的值和匹配条件输入主数据集中的缺失值

sas、sas-iml

我对SAS的理解非常基础。我正在试着做这样的事情，我需要帮助。我有一个包含20,000个观测值的主数据集A，其中Col1存储城市，Col2存储里程。Col2包含大量缺失的数据。如下所示。 +----------------+---------------+ | Col1 | Col2 | +----------------+---------------+ | Gary,IN | 242.34 | +----------------+---------------+ | Lafayette,OH | .

浏览 2提问于2014-08-17得票数 0

1回答

对于不一致分隔的数据，是否缺少明显的信息？

sas

我已经在SAS中构建了一些东西来拉下Yahoo！财务.csv数据。我构建的代码现在运行得很好，并且我已经在代码中构建了一些健壮的错误处理。不过，我遇到的数据问题是.csv提要不受支持，也不干净。数据以逗号分隔，但某些数据中也包含逗号。有些字段用引号括起来，有些则没有。此外，字段的长度也有很大的变化。例如，像Market Capitlisation这样的领域可能会运行在几百万到数千亿之间。因此，如果您将多个股票的多个股票指标传递到Yahoo！同时，您将获得多行.csv数据，其中每个字段位于不同的位置，具有不同的长度，并且分隔不一致。我已经尝试了多个infile选项，可以单独处理这些错误中的

浏览 0提问于2014-03-03得票数 0

1回答

合并SAS行与合并函数

sas、coalesce

我正在努力将下面的行合并到SAS中。以下是数据： StudentNumber Test1 Test2 Test3 001 . 86 . 001 94 . . 001 . . 75 002 68 . . 002 . 82 . 002 . . 97 我希望这些行看起来如下所示： StudentNumber

浏览 2提问于2018-11-26得票数 1

回答已采纳

2回答

水平地将三个SAS数据集与列重命名相结合

sas、proc-sql

我在SAS企业指南工作，希望将三个独立的数据集合并成一个数据集。所有数据集都有一个具有相同长度、数据类型和列标题的列：我的数据如下(三个表，每列一列)： data1 data2 data3 apples apples apples 100 200 300 55 77 80 3422 32432 1234 我希望输出数据如下(一个表，3列)。列标题应更改为我选择的名称： output_data green_apples

浏览 3提问于2017-02-28得票数 0

回答已采纳

2回答

使用动态命名范围导入SAS过程

excel、sas、named-ranges

我有一个包含数据库信息的工作簿，该工作簿分为多个选项卡，我希望将这些选项卡导入到SAS中以进行进一步操作。这些数据库表的维度因选项卡而异，此外，在此项目的整个使用期限内，表的维度可能会有进一步的更改。因此，我在每个选项卡中设置了动态命名范围，这样它就可以提取我所需的确切维度，即我的命名范围TBL_SHEET1 =OFFSET(SHEET1!$A$1,0,0,COUNTA(SHEET1!$A:$A),COUNTA(SHEET1!$1:$1)-2) 现在的SAS问题是，当我使用proc导入代码时，它似乎不认为这些命名范围“存在”，并在日志中返回一条失败消息。有什么办法可以解决这个问题吗？或者

浏览 0提问于2017-05-11得票数 1

3回答

将SAS数据集导入R

r、csv、import、sas

我正在尝试将SAS数据集导入R(我无法共享该数据集)。SAS将列视为数字或字符。但是，一些数字列具有编码的字符值。我使用了sas7bdat包来引入数据集，但是number列中的那些字符值返回NaN。我想要实际的字符值。我已经尝试将数据集导出到csv和制表符分隔的文件。然而，我最终得到了两行的观察结果( SAS的一个问题，我还不能解决)。由于有超过9000个观测值，因此我不能返回并手动查找那些需要2行的观测值。你知道我该怎么解决这个问题吗？

浏览 45提问于2020-08-27得票数 0

回答已采纳

1回答

SAS Proc不存在查询与数据步骤a=1 b=0

sas、proc-sql

试图测量两个小数据集的性能，以确定一个大得多的数据集的有效执行方法。 *这项测试是在32个观测数据集和37个观测数据集上进行的。这两种方法都给出了相同的结果，稍微不同的过程时间。我有一个简单的数据步骤： data check; merge d1(in=a) d2(in=b); by ssn; if a=0 and b=1; run; 数据步骤方法(第一次执行)日志产生以下结果： NOTE: There were 32 observations read from the data set WORK.D1. NOTE: There were 37 observations read from

浏览 1提问于2015-12-22得票数 1

回答已采纳