我正在尝试创建一个数据集,它将显示重复的事务。我遇到的麻烦是,当一个order_id上有多个订单时。被分配到2s的记录,我会考虑重复的订单。
data have;
input acct_id order_id;
datalines;
1 121
1 122
2 123
2 124
3 125
3 125
3 125
3 126
3 126
3 126
data want;
set have;
by acct_id order_id;
if first.acct_id then order_count = 1;
else order_count =2;
run;我想要的输出在下面。
acct_id | order_id | order_count
1 121 1
1 122 2
2 123 1
2 124 2
3 125 1
3 125 1
3 125 1
3 126 2
3 126 2
3 126 2我已经编码出来的东西,我觉得很接近,但我无法弄清楚。
发布于 2022-02-28 18:16:37
data want;
set have;
by acct_id order_id notsorted;
if first.acct_id then order_count=0;
if first.order_id then order_count+1;
put acct_id order_id order_count;
run;acct_id order_id order_count
1 121 1
1 122 2
2 123 1
2 124 2
3 125 1
3 125 1
3 125 1
3 126 2
3 126 2
3 126 2https://stackoverflow.com/questions/71298165
复制相似问题