文章/答案/技术大牛

发布

社区首页 >问答首页 >需要一个R函数来通过Y计数复制X数据，其中X包含一些重复的值

问需要一个R函数来通过Y计数复制X数据，其中X包含一些重复的值
EN

Stack Overflow用户

提问于 2021-12-01 19:54:33

回答 3查看 44关注 0票数 1

我有一个相当大的数据集(18,000行)，其中有2列没有兴趣。我想把一个(X)作为定量值，另一个(Y)作为计数，并根据计数重复X数据。由于数据的性质，X列中有重复值，我只想创建一个包含所有X值及其重复测量值的新数据集。我尝试执行以下操作，但它返回一个无效的时间参数：rep, df$X, df$Y

我不知道为什么会发生这个错误，也不知道从这里往哪里走。任何帮助都是非常感谢的。下面是我的数据的一个小样本。

histogram

rep

回答 3

Stack Overflow用户

回答已采纳

发布于 2021-12-01 20:03:04

当一个或多个Y为NA (或负)时，我可以再现该错误：

df
#       X  Y
# 1  8.76  3
# 2 24.69 NA
# 3  6.24  2
# 4  1.17  0
# 5  6.54  3
# 6 10.29  0
# 7 11.04  1
# 8 16.71  1
rep(df$X, df$Y)
# Error in rep(df$X, df$Y) : invalid 'times' argument
df$Y[2] <-  -1
rep(df$X, df$Y)
# Error in rep(df$X, df$Y) : invalid 'times' argument

我们可以用NA替换0

rep(df$X, pmax(0, df$Y, na.rm = TRUE))
#  [1]  8.76  8.76  8.76  6.24  6.24  6.54  6.54  6.54 11.04 16.71

数据

df <- structure(list(X = c(8.76, 24.69, 6.24, 1.17, 6.54, 10.29, 11.04, 16.71), Y = c(3L, NA, 2L, 0L, 3L, 0L, 1L, 1L)), row.names = c(NA, -8L), class = "data.frame")

票数 2

Stack Overflow用户

发布于 2021-12-01 20:00:21

也许你在找uncount

library(tidyr)
library(dplyr)

df %>% 
  uncount(count)

这会返回

# A tibble: 10 x 1
   value
   <dbl>
 1  8.76
 2  8.76
 3  8.76
 4  6.24
 5  6.24
 6  6.54
 7  6.54
 8  6.54
 9 11.0 
10 16.7

票数 2

Stack Overflow用户

发布于 2021-12-01 20:31:42

A基本R备选方案：

transform(df[rep(seq_len(nrow(df)), df$y),], y = sequence(df$y))

产出：

        x y
1    8.76 1
1.1  8.76 2
1.2  8.76 3
3    6.24 1
3.1  6.24 2
5    6.54 1
5.1  6.54 2
5.2  6.54 3
7   11.04 1
8   16.71 1

数据：

df <- structure(list(x = c(8.76, 24.69, 6.24, 1.17, 6.54, 10.29, 11.04, 
16.71), y = c(3L, 0L, 2L, 0L, 3L, 0L, 1L, 1L)), class = "data.frame", row.names = c(NA, 
-8L))

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70190468

复制

相似问题

问需要一个R函数来通过Y计数复制X数据，其中X包含一些重复的值
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问需要一个R函数来通过Y计数复制X数据，其中X包含一些重复的值EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问需要一个R函数来通过Y计数复制X数据，其中X包含一些重复的值
EN