为唯一ID首次观察创建一个虚拟变量_为每个唯一ID创建一个图_如何创建条件语句，为每个ID动态创建一个唯一的按钮？ - 腾讯云开发者社区

我正在处理一个带有唯一名称和记录日期列表的面板数据帧。我想为第一次记录名称创建一个虚拟变量-即第一次记录名称观察时采用值1的虚拟变量，第二次、第三次使用0 ...时间到了。任何帮助都将不胜感激。

浏览 17提问于2021-10-12得票数 0

回答已采纳

1回答

为观察对创建虚拟变量

r、dplyr、group-by、grouping、dummy-variable

我想要做的是：，我想做两个虚拟变量。一个是countrypair_dummy，定义如下。对于每个group_number，对于countrypairlist中的每个唯一AB-CD对(每行已经列出了由,分隔的唯一对，按构造)，在每个Date中为这两个国家设置countrypair_dummy因此，对于乡村对CZ-EP和group_number == 773，我们在从1990-10-08到1992-12-31的数据中都观察到了countrydummy == 1，而count

浏览 7提问于2022-11-02得票数 0

回答已采纳

3回答

有没有办法为两个时间点之间的年份创建虚拟变量？

r、dummy-variable

我正在处理一些时间序列数据，其中每一行都是对一个人的观察，并且我有两个时间段，开始日期和结束日期。我尝试为每一年创建虚拟变量，这样如果年份落在开始日期和结束日期之间，则将虚拟变量编码为1。我看过一些包，但它似乎从已经提供的变量中创建了虚拟对象。由于其中一列可能遗漏了一些年份，我正在尝试寻找替代选项。id <- c(1:3) start.date <-

浏览 61提问于2019-08-14得票数 2

回答已采纳

2回答

按personid创建一个虚拟变量

python、pandas

我有一个包含个人和日期的时间序列数据集。我想创建一个虚拟变量"newpers"，它首次假定值1，按时间顺序，id将显示在数据集中。我一直在试着按组/排序为每个人的第一个软骨学日期。然后，虚拟变量可以是newpers=(yearmo==firstmo)，但我似乎无法让groupby/sort不抛出错误。

浏览 0提问于2014-04-16得票数 0

回答已采纳

4回答

在SAS中:如何标记一组变量值的唯一组合

sas

在SAS中，如何为一组变量的每个唯一组合创建标识符？ID3 0 1 1 1 1 1 I

浏览 0提问于2018-11-27得票数 2

回答已采纳

1回答

如何对数据进行子集

stata

我想创建一个数据子集，其中如果与唯一id相关的其中一个观察值满足特定标准，则维护与唯一id相关的所有观察值。例如，我希望保留所有与学生相关的学期观察(变量recordnum) (变量id)，如果他们在其中一个学期接受了资助(变量aid)。

浏览 0提问于2016-10-18得票数 0

3回答

替代不折叠df的聚合函数

r、count、aggregate

我有个人级别的数据，我想要创建一个新的变量，其中有一个家庭中的孩子数。我已经为孩子们创建了一个虚拟变量(如果是age<18，则为0)。我目前正在使用聚合函数，其中HH_ID是一个家用标识符。No_kids <- aggregate(child ~ HH_ID, data = df, sum) 这段代码可以工作，但是数据框架会崩溃，而我希望为该家庭的每个

浏览 4提问于2016-10-26得票数 1

回答已采纳

3回答

在SAS中，如何在交叉表中组合变量的多个级别

sas

我有一个包含ID变量的数据集和一个有四个级别的变量。我想通过数据集中发生的第二个变量的值的每个不同组合来计算数字唯一ID值。Var2-------- 2 ABCD4 ABC6 ABCD 每个观察都是这两个变量的不同组合。如果第二个变量有四个级别，则有2^4-1组合的可能.我想要创建一个

浏览 4提问于2018-11-30得票数 1

回答已采纳

1回答

适用于移动应用的Flash builder/AS3唯一设备ID

actionscript-3、apache-flex、flash-builder

我可以在Flash Builder/AS3中使用唯一的设备ID来区分Flex移动项目中的设备吗？我试图避免编写登录/注册系统的代码。

浏览 0提问于2012-01-16得票数 0

回答已采纳

1回答

当数据有缺失值时生成和分组

stata

我想使用egen和group为观察值创建一个标识符变量，其中包含一组特定变量的相同值。但是，一些变量包含缺少的数据，导致相应的标识符具有缺失值。有没有办法绕过这个问题(除了暂时填写一些随机值)？例如，我有变量v1和v2。如果v1和v2具有相同的值，我希望观察值具有唯一的id。我想做一些类似的事情： egen id = group(v1 v2)

浏览 1提问于2013-06-18得票数 1

1回答

Stata:替换用于多个观察的虚拟

time-series、stata

我有一个纵向数据集，其中包含一个虚拟(dummy1)变量，用于指示给定的category是否在特定年份内满足条件。我也希望在接下来的二十年中考虑到这一事件。因此，我想创建一个新的虚拟(dummy2)，它的值为1，用于在dummy1为1的观察之后的19个观测，以及相同的观察(下面的例子)。我试图用延迟操作符创建一个循环，但到目前为止一直未能使其正常工作。

浏览 2提问于2014-03-07得票数 0

回答已采纳

3回答

是否根据另一个变量的值创建虚拟变量？

r、function、loops、dataframe

我有一个大型数据集，其中包含以下结构的多个列 A B 2. 1. D24. 3. D1 5. 3.D2 我正在尝试基于列A中的唯一观察值创建一个新的数据框，其中包含一个编码为1=D1，2=D2，3=both的虚拟变量" dummy“，如下所示： A.

浏览 24提问于2020-06-10得票数 0

1回答

如何从长到宽重塑

stata

我在Stata中有一个名为random_variable的变量，它包含随机数，例如，从1到100，但可能不是顺序的(可能是1，7，2)。我希望在数据集中创建15个新变量，每个变量包含前7项(例如，对于工作日而言，7可能是任意的)，但第15项除外，第15项只包含2个条目。(最后一栏为14*7=98+2)

浏览 17提问于2022-02-19得票数 0

2回答

使用SAS中的UPDATE语句按组结转上一次观测

sas

我有一个数据集，其中包含对患者及其在多个时间点的诊断的观察。用于诊断的虚拟变量的值有时会丢失。下面是一个示例： infile datalines dsd delimiter=' '; run; 如果当前观察中缺少虚拟变量的值，我希望在患者ID相同的情况下，继续使用前一个

浏览 1提问于2016-05-11得票数 0

1回答

预测具有类别的数据集中的连续输出

machine-learning、python、classification、scikit-learn、regression

让我们这样说:我正在做一个机器学习项目，我正在处理一个4250,13形状的数据集，它已经被归为7类了！请注意，不能将这些类别视为预测器。5.132556 % of the datasetFSDC 2.969247 % of the dataset 我有一个连续的输出，我想预测'CGPA'，所以任务是一个回归，我的目标是在每个类别中预测它，最后的决定将是预测输出最大化的类别。对于一个新的输

浏览 0提问于2017-07-23得票数 1

1回答

创建具有200k唯一值的伪变量

python、jupyter-notebook、data-science

我试图为分类数据集创建一个虚拟变量，但问题是python没有兼容的ram来运行代码，因为唯一值太大而无法创建虚拟变量。它是一个具有500k行和200k唯一值的大型数据集。是否可以创建一个具有200k唯一值的虚拟变量？

浏览 0提问于2021-04-21得票数 2

1回答

为日期范围内的观察创建虚拟变量

r、date

我想要创建一个新的虚拟变量，如果我的观察值在某一组日期范围内，则打印1，如果不是，则打印0。我的数据集是一个10年的政治捐款列表，我想做一个虚拟变量来标记捐款是否在一定的日期范围内进行。有没有人知道这样做的正确方法是创建一个循环？我一直在研究这个问题，这个问题看起来很相似，但我认为我的问题会更复杂一些：举个例子，我有一个可变的列表日期来记录缴款，我想创建

浏览 4提问于2014-02-23得票数 0

回答已采纳

2回答

R中每个范畴变量(id)的第一次观测的虚拟变量

问题:，我想在R中创建一个虚拟变量first，如果另一个虚拟变量的值从0变为1，条件是它不是id数的第一次观察。这背后的问题是，我想承认那些在观察到的时间内在面板上进入市场的公司。举个例子，我尝试用一个小样本集来创建它：dummy <- c(0,1,1,0,1,1,0,1) df <- da

浏览 3提问于2015-01-14得票数 2

回答已采纳

2回答

如何在R中进行求和运算，只在一行中得出结果

因此，我有一个包含1380个观测值的R数据集，如果个人富裕，则将一个虚拟变量编码为1。我想对数据集中值为1的所有个体求和，但每当我创建一个新变量，将其值求和为： dataset_union$sum_high<- sum(dataset_union$high_inc) 它创建的新变量会对数据集中的每个观察值重复求和的结果我希望这个变量只在第一

浏览 22提问于2019-02-05得票数 0

3回答

R:删除(或分组)冗余观测/重复

我有一个spotify数据集，有很多观察。我已经将分类genre变量更改为虚拟变量，这将在d

浏览 8提问于2021-08-26得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云