首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >R为不使用循环的记录分配ID

R为不使用循环的记录分配ID
EN

Stack Overflow用户
提问于 2019-07-17 03:06:36
回答 2查看 95关注 0票数 1

我需要循环遍历数据表"A“,并根据条件为该记录或一组记录分配增量ID,如:

代码语言:javascript
复制
library(data.table)
A <- data.table(x = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14), 
  y = c(2,2,2,2,2,2,2,2,3,3,3,3,3,3), z = 0)

for(i in 1:nrow(A))
 {
   if((A[i]$x %% A[i]$y) == 0) {A[i]$z <- i}
   print(i)
 }

Z列变成一种滚动ID。我需要在不使用循环的情况下执行相同的操作。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-07-17 06:37:53

或者您可以尝试这样做(sinde已经包含了索引值)

在满足条件x %% y == 0的行上用x值更新(通过引用)z值.在所有其他行中,z保留它的原始值(即0)。

代码语言:javascript
复制
A[ x %% y == 0, z:=x]

#     x y  z
# 1:  1 2  0
# 2:  2 2  2
# 3:  3 2  0
# 4:  4 2  4
# 5:  5 2  0
# 6:  6 2  6
# 7:  7 2  0
# 8:  8 2  8
# 9:  9 3  9
# 10:10 3  0
# 11:11 3  0
# 12:12 3 12
# 13:13 3  0
# 14:14 3  0

但是当然,您也可以使用.I获取行的索引。

代码语言:javascript
复制
A[ x %% y == 0, z := .I]

也会奏效..。根据列类的不同,您必须将一些整型列设置为类double,以避免发出警告消息。

基准

高达50000行,罗纳克的回答更快,在此之上,.I解决方案是‘赢’。

用于基准测试的代码

代码语言:javascript
复制
vec <- c( seq( 1,10000, by = 1000), seq( 1,100000, by = 10000), 
          seq( 1,1000000, by = 100000), seq( 1,10000000, by = 1000000) )

l <- lapply( vec, function(x){
  A <- data.table(x = as.double( 1:x ), 
                  y = as.double( sample(2:3, x, replace = TRUE) ), 
                  z = as.double(0) )
  m <- microbenchmark::microbenchmark(
    Ronak = { 
      DT <- copy(A)
      inds <- DT$x %% DT$y == 0
      DT$z[inds] <- which(inds)
    },
    Wimpel = {
      DT <- copy(A)
      DT[ x %% y == 0, z:=as.double(.I)]
    },
    times = 10 )
  setDT(m)[, .(n = x, median = median(time)), by = .(expr)][]
})

library(scales)
library(ggplot2)
ggplot( data = rbindlist(l), aes( x = n, y = median/1000000, group = expr, colour = expr )) + 
  geom_smooth( se = FALSE ) +
  labs( x = "rows",
        y = "median [ms]" ) 
票数 4
EN

Stack Overflow用户

发布于 2019-07-17 03:10:12

您可以获得%%操作符返回0并在位置分配索引值的索引。

代码语言:javascript
复制
inds <- A$x %% A$y == 0
A$z[inds] <- which(inds)

A
#     x y  z
# 1:  1 2  0
# 2:  2 2  2
# 3:  3 2  0
# 4:  4 2  4
# 5:  5 2  0
# 6:  6 2  6
# 7:  7 2  0
# 8:  8 2  8
# 9:  9 3  9
#10: 10 3  0
#11: 11 3  0
#12: 12 3 12
#13: 13 3  0
#14: 14 3  0
票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57067996

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档