在dplyr中按组创建具有最新日期的新变量

在dplyr中，可以使用group_by()和mutate()函数来按组创建具有最新日期的新变量。

首先，使用group_by()函数按照需要的组进行分组。然后，使用mutate()函数创建新变量，并使用ifelse()函数结合max()函数来判断每个组中的最新日期，并将其赋值给新变量。

下面是一个示例代码：

library(dplyr)

# 创建一个示例数据框
data <- data.frame(
  group = c("A", "A", "B", "B", "C", "C"),
  date = c("2022-01-01", "2022-02-01", "2022-03-01", "2022-04-01", "2022-05-01", "2022-06-01")
)

# 按组创建具有最新日期的新变量
data <- data %>%
  group_by(group) %>%
  mutate(new_variable = ifelse(date == max(date), "最新日期", "非最新日期"))

# 查看结果
print(data)

在上述代码中，我们首先加载dplyr库，并创建一个示例数据框data，其中包含两列：group和date。然后，使用group_by()函数按照group列进行分组。接下来，使用mutate()函数创建一个新变量new_variable，并使用ifelse()函数结合max()函数来判断每个组中的最新日期。如果日期等于最大日期，则将新变量赋值为"最新日期"，否则赋值为"非最新日期"。最后，使用print()函数查看结果。

这是一个简单的示例，你可以根据实际需求进行修改和扩展。在实际应用中，你可以根据具体的业务场景和数据结构来使用dplyr中的其他函数和操作符，以实现更复杂的数据处理和变量创建操作。

腾讯云相关产品和产品介绍链接地址：

腾讯云官网：https://cloud.tencent.com/
云服务器（CVM）：https://cloud.tencent.com/product/cvm
云数据库 MySQL 版：https://cloud.tencent.com/product/cdb_mysql
人工智能平台（AI Lab）：https://cloud.tencent.com/product/ailab
物联网开发平台（IoT Explorer）：https://cloud.tencent.com/product/iothub
移动应用开发平台（MADP）：https://cloud.tencent.com/product/madp
云存储（COS）：https://cloud.tencent.com/product/cos
区块链服务（BCS）：https://cloud.tencent.com/product/bcs
腾讯云元宇宙：https://cloud.tencent.com/solution/virtual-world

为每个组中的最新日期创建新的列指示符

r、dplyr

嗨，我有一个像这样的数据集。我想要创建一个新列，它是一个指示符，用于显示组的日期是否是最新的。我附上了以下样本数据： Item Group Date item1 a 1/1/2019 item2 a 2/1/2019 item3 a 3/1/2019 item6 b 1/1/2019 item7 b 2/1/2019 item8 b 2/1/2019 item9 b 3/1/2019 对于每个组(a或b)，我希望创建一个指示符，显示该日期是否是其组内的最新日期。我附上了一个我想要完成的事情的样本： Item Group

浏览 3提问于2020-05-05得票数 0

回答已采纳

1回答

添加一个新的结束日期列，该列派生自R中两个开始日期之间的差异

r、date、lubridate

我有一个数据框架，其中包含每个人的人员和地址数据。还有一个"STARTING_DATE“列，表示每个人开始居住在特定地址的时间。有些人有多个地址，这意味着有多个开始日期。我想要做的是创建一个"ENDING_DATE“列，它计算两个开始日期之间的差异，并选择新开始日期之前的日期。请看下面的例子(这是我想要的输出)： PersonID Address Starting_Date Ending_Date 1 1st Residence 2010-02-05 2

浏览 11提问于2021-08-03得票数 0

1回答

如何使用scale_x_date使用ggplot创建自定义日期标签

r、ggplot2

当我在date_labels中使用scale_x_date =“%b%y”时，勾标会变得非常混乱，因为每个月都会出现年份。(我特别想每个月都贴上标签。)我宁愿这一年只出现在日期范围的开始和结束，也出现在12月和1月。下面是我最小的代表性例子。我希望使用一个函数，在12月、1月、月份和最后一个月使用date_labels =“%b%y”创建滴答标签，然后对所有其他月份使用date_labels =“%b”。作为第一次尝试，我尝试用函数(切换到注释行)来复制我现有的(杂乱的)滴答标签，但是无法这样做。具体来说，在这个例子中，我希望勾标是8月20日、9月、10月、11月、12月20日、1月21日

浏览 4提问于2021-05-21得票数 0

回答已采纳

3回答

在dplyr中按组求和后用行百分比计算列

r、aggregate、dplyr、frequency、crosstab

使用dplyr，我将为两个类别生成一个简单的汇总表： # Data data("mtcars") # Lib require(dplyr) # Summary mt_sum <- mtcars %>% group_by(am, gear) %>% summarise(n = n()) %>% spread(key = am, value = n) 它产生了预期的结果： Source: local data frame [3 x 3] gear 0 1 (dbl) (int) (int) 1 3 15

浏览 3提问于2015-12-03得票数 4

回答已采纳

3回答

使用dplyr汇总逻辑值并按多个因素分组

r、group-by、dplyr、reshape2

我想按两列(部门和产品线)对数据框进行分组，并输出一个新的数据框，其中包含每个部门和产品线的选定逻辑值的计数。原始数据的结构如下： product department line date apple A big 201707 cherry A midlle 201609 potato B midlle 201801 peach C small 201807 pear B big 201807 日期是数字，其他变量是字符。我想添加两列x和y，其中x表示日期是2018年，y表示日期是201807。按部门和行分组，并按降序

浏览 0提问于2018-08-17得票数 1

1回答

如何改变变量的值，基于几个条件- R？

r、dataframe、multiple-conditions

我有一个相当大的数据集，需要根据几个条件聚合一些行。但首先，我必须更改其中一个变量的值；日期变量。以下是一个例子： df <- data.frame( Date=c("2021-01-07", "2021-01-10", "2021-01-07", "2021-01-06", "2021-01-06"), Specie=c("cod", "cod", "cod", "cod", "haddock"), Size=c(

浏览 4提问于2022-06-27得票数 1

回答已采纳

2回答

根据组内以前的值创建新的计数变量

r、dplyr、count、conditional-statements、lag

我有一个有组和时间标识的数据。现在，我想创建一个名为X2的新计数变量，条件是每个组中以前的X1值。假设我有下面的dataframe、变量group、time、X1，并且希望创建X2。X2的值应该是一个计数变量，该变量指示句点的数量(即行)，因为X1最后一次等于给定组中的1。如果X1的所有先前值都为0，则应该缺少X2。 group time X1 X2 1 1 1 0 NA 2 1 2 0 NA 3

浏览 2提问于2020-04-09得票数 0

回答已采纳

1回答

我有一个纵向数据集，其中包含一个人首次就诊时的身高数据。其他行是空的。但有时一个人有两种价值观和两种不同的价值观。我想用组的平均值替换缺少的值，并用平均值替换现有的值。我试过了： data$variable <- ave(data$variable, data$group, FUN = function(x) ifelse(is.na(x), mean(x, na.rm = TRUE), x)) 此代码用平均高度替换缺少的值，但仍保留现有高度。

浏览 0提问于2019-08-13得票数 0

1回答

按组，根据组中是否有任何行采用特定值来更改列值

我正在尝试使这些数据变宽而不是变长。而不是重铸(这似乎变得棘手的基于日期)，我正在尝试另一种方法。对于每个唯一的候选人，我希望填充名为"Felony1“、"Felony1Date”、"Misdemeanor1“和"Misdemeanor1Date”的新字段(可能会添加更多重罪和轻罪，但这目前无关紧要)。(也可以将大于1的数字视为1。) CandidateID Conviction.Date Felony Misdemeanor 1 1234 2007-09-27 0 3 2 1234 2009-

浏览 0提问于2016-01-03得票数 0

2回答

如何通过R中的时间序列将特定日期的NA替换为同一日期的平均值？

r、dplyr

我有一个包含降雨时间序列的数据"df“ str(df) 'data.frame': 10227 obs. of 6 variables: $ Date : Date, format: "1990-01-01" "1990-01-02" "1990-01-03" ... $ Month: Ord.factor w/ 12 levels "Jan"<"Feb"<"Mar"<..: 1 1 1 1 1 1 1 1 1 1 ... $ Year : n

浏览 3提问于2019-12-04得票数 1

回答已采纳

2回答

创建基于dplyr的函数

r、dplyr

我在考虑基于dplyr包创建函数。我见过很少的例子，比如看门人包和Organism.dplyr。但是，我不知道我是否能够扩展或固有dplyr特性，甚至可能的话。例如。我想要的： data %>% group_by(columnX) %>% my_mutate_like_function() 但是，它不起作用，我看到一个关于它的帖子使用do()作为一种替代.，但是，这不是我想要的。有人能帮我吗？谢谢。 ==遵循一个代码示例(编辑) == data <- data.frame(groupname = c('A', 'B', 'A'

浏览 6提问于2017-08-03得票数 0

1回答

根据data.frame后续行中的条件填充分组条目的列。

r、dplyr

我有一个大型的临床数据集，我计划填充更多的列，标准将几乎是相似的，因此它可能归结为一个类似的问题。到目前为止，我已经知道了，首先我需要基于patient_id对我的条目进行分组，但是我一直无法从这里开始。下面是数据的快照。在R中复制和运行时，它创建一个名为data.frame的myDF myDF <- structure(list(patient_id = c(1L, 1L, 1L, 1L, 1L), date = structure(c(17167, 17168, 17169, 17170, 17171), class = "Date"), date_recrui

浏览 2提问于2017-03-21得票数 0

回答已采纳

4回答

添加与R中的温度相关的条件为“热”或“冷”的列

r、dplyr

我想创建一个新的列，条件是"if Temperatur > 80 show hot in row，否则在行中显示冷“ 这是我的代码： tempcat_aq <- aq %>% group_by(aq$Temp) %>% mutate(TempCat = if(any(aq$Temp > 80) "hot" else "cold")) 我正在使用R中内置的airquality数据帧和dplyr库。谢谢你帮我的忙。

浏览 1提问于2021-04-30得票数 1

1回答

如何从几个问号报价中取最小值，从一个单栏取两列投标报价中的最大值？

r、dplyr、tidyr、quantitative-finance

我有一个数据集包含出价和询价3天和股票。以下是数据集的部分。我还提供了一个与样本数据集的链接，以说明问题的谱性。 > dput(head(q,30)) structure(list(Date = structure(c(1471424400, 1471424400, 1471424400, 1471424401, 1471424401, 1471424406, 1471424407, 1471424415, 1471424417, 1471424514, 1471424527, 1471424567, 1471424576, 1471424606, 1471424607, 147

浏览 1提问于2016-08-22得票数 0

1回答

根据使用R的组中的条件为前面的行赋值

r、dataframe、data-manipulation

我有一个按groupID和日期排序的数据框架 > d1 <- data.frame(groupID = c(1,1,1,1,1,3,3,3,3), date = c(1,2,3,4,5,6,7,8,9), value = c(1,1,25,1,1,25,1,25,1)) >d1 groupID date value 1 1 1 1 2 1 1 3 25 1 4 1 1 5 1 3 6 25 3

浏览 3提问于2017-06-22得票数 0

回答已采纳

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在dplyr中按组创建具有最新日期的新变量

相关·内容

为每个组中的最新日期创建新的列指示符

添加一个新的结束日期列，该列派生自R中两个开始日期之间的差异

如何使用scale_x_date使用ggplot创建自定义日期标签

在dplyr中按组求和后用行百分比计算列

使用dplyr汇总逻辑值并按多个因素分组

如何改变变量的值，基于几个条件- R？

根据组内以前的值创建新的计数变量

删除R中给定列中具有某一连续值的所有行

将两个特定行的值连接为新行，并使用dplyr以分号分隔值。

如何在dplyr中仅将函数应用于组的第一行？

根据r中的data.table中的多个条件创建列

在R中用中位数按日期计算数据

如何用mean by分组推算缺失值并替换现有值

按组，根据组中是否有任何行采用特定值来更改列值

如何通过R中的时间序列将特定日期的NA替换为同一日期的平均值？

创建基于dplyr的函数

根据data.frame后续行中的条件填充分组条目的列。

添加与R中的温度相关的条件为“热”或“冷”的列

如何从几个问号报价中取最小值，从一个单栏取两列投标报价中的最大值？

根据使用R的组中的条件为前面的行赋值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐