我有dataframe包含变量:
Group high weigh age col5
row1 A 12 57 18 AA
row2 C 22 80 29 BB
row3 B 17 70 20 CC
row4 A 13 60 26 DD
row5 D 19 69 25 AA
row6 B 10 15 19 BB
row7 C 20 66 22 CC
row8 D
具有以下df。我需要转换第二个变量,其中所有名为(阿尔巴尼亚、安道尔拉和安哥拉)的观察值都归入观察名为GROUP的组中。(并在第三个变量中添加它们的相关值。我必须为不同的国家集团做同样的事情。
reporter partner value
df> 1 Rep. of Korea World 162466097148
2 Rep. of Korea
示例数据:
(tmp_df <-
expand.grid(id = letters[1:3], y = 1:3))
# id y
# 1 a 1
# 2 b 1
# 3 c 1
# 4 a 2
# 5 b 2
# 6 c 2
# 7 a 3
# 8 b 3
# 9 c 3
以下工作:
tmp_df %>%
group_by(id) %>%
mutate_at(which(colnames(.) %in% c("y")),
sum)
# id y
# <fct
我有一个时间序列,大约有100个日期,每个日期有50个实体(如此5,000行)和50列(都是不同的变量)。如何筛选数据帧中的每一列(每个唯一日期),以保持每个日期上每列值的前1/3。然后得到该组在那个日期的平均回报。谢谢。
我的数据组织如下,但每列中的数字都是随机的,就像"a“列中的数字一样(这是一个示例,实际数据有更多的列和更多的行):
Date Identity Return a b c d e f... ...z
2/1/19 X 5 75 43 6
我最后一个问题的答案帮助我理解了dplyr n()。但我仍然无法解决我想要解决的问题。所以,我在这里张贴数据和实际问题。数据如下
finalCalledPartyNumber Call Day Call Date Block Answered Call Duration Opty ID Opty Created Date BC ID
19183598259 Monday 2016-12-05 12:26:46 Block 2(12:30 pm) 1 5 1234