这是一个示例data.table
。
set.seed(123)
mydt <- data.table(id = 1:100, x = sample(LETTERS[1:6], size = 100, replace = TRUE), group = paste0("group", sample(1:3, size = 100, replace = TRUE)), prob = runif(100, 0, 1))
我使用tydir::spread
从长格式到宽格式
mydt2 <- mydt %>% spread(group, prob)
然后,我想定义新列,如
mydt2[!is.na(group1), new.col := x]
如果我这样做,我会收到以下警告
Warning message:
In `[.data.table`(mydt2, !is.na(group1), `:=`(myscale, x)) :
Invalid .internal.selfref detected and fixed by taking a (shallow) copy
等等,如果我用这个代替
mydt2 <- copy(mydt %>% spread(group, prob))
mydt2[!is.na(group1), myscale := x]
我没有收到任何警告。我不明白这种行为。有人能提供帮助吗?使用copy()
是解决这个问题的正确方法吗?
发布于 2017-10-27 03:38:33
我认为使用dcast
是可行的。但是,使用tidyr::spread
的一个可能的解决方案是将setDT()
添加到管道调用中,即,
set.seed(123)
# install.packages(c("data.table"), dependencies = TRUE)
library(data.table)
mydt <- data.table(id = 1:100, x = sample(LETTERS[1:6], size = 100, replace = TRUE),
group = paste0("group", sample(1:3, size = 100, replace = TRUE)),
prob = runif(100, 0, 1)
)
class(mydt)
mydt2 <- mydt %>% tidyr::spread(group, prob) %>% setDT()
mydt2[!is.na(group1), new.col := x]
https://stackoverflow.com/questions/46958830
复制