文章/答案/技术大牛

发布

社区首页 >问答首页 >R循环优化/循环太耗时了

问R循环优化/循环太耗时了
EN

Stack Overflow用户

提问于 2016-08-02 21:59:03

回答 1查看 105关注 0票数 0

下面的循环需要很长时间。有没有更省时的方法呢？下面的data.table由27个变量和超过600k的观察值组成。

data <- read.table("file.txt", header = T, sep= "|")
colnames(data)[c(1)] <- c("X")
data <- as.data.table(data)
n=1;
vector <- vector()
for(i in 2:nrow(data))
{
  if(data[["X"]][i] != data[["X"]][i-1])
  {
   n=1; vector[i]=1} 
 else {
   n=n+1; vector[i]=n}}

基本上，我需要在X中索引唯一条目的每次出现，即第一次出现，第二次出现，等等，然后将其作为附加列合并到现有数据中。然而，我在编译向量时得到了一些东西。

谢谢。

for-loop

optimization

time

data.table

回答 1

Stack Overflow用户

回答已采纳

发布于 2016-08-02 22:08:16

首先，使用fread

DT <- fread("file.txt", sep = "|")

接下来，使用setnames

setnames(DT, 1, "X")

最后，使用rowid

DT[ , vector := rowid(X)]

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/38722565

复制

相似问题

问R循环优化/循环太耗时了
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R循环优化/循环太耗时了EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问R循环优化/循环太耗时了
EN