我有一个相当大的数据集(18,000行),其中有2列没有兴趣。我想把一个(X)作为定量值,另一个(Y)作为计数,并根据计数重复X数据。由于数据的性质,X列中有重复值,我只想创建一个包含所有X值及其重复测量值的新数据集。我尝试执行以下操作,但它返回一个无效的时间参数:rep, df$X, df$Y
我不知道为什么会发生这个错误,也不知道从这里往哪里走。任何帮助都是非常感谢的。下面是我的数据的一个小样本。
8.76 3
24.69 0
6.24 2
1.17 0
6.54 3
10.29 0
11.04 1
16.71 1发布于 2021-12-01 20:00:21
也许你在找uncount
library(tidyr)
library(dplyr)
df %>%
uncount(count)这会返回
# A tibble: 10 x 1
value
<dbl>
1 8.76
2 8.76
3 8.76
4 6.24
5 6.24
6 6.54
7 6.54
8 6.54
9 11.0
10 16.7 https://stackoverflow.com/questions/70190468
复制相似问题