这可能是一个基本问题,但如何围绕data.table中的特定值对时间序列进行子集?我有数据:
DT <- data.table(time = seq(1, 14), b = c(0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1 ,0, 0))现在我想在b中查找所有带有1的行,并在找到的观察值之前和之后保留,比方说2行。如果有一个灵活的窗口,您可以在检测到的观察值之前和之后定义所需的时间窗口,这将是很好的。结果应该如下所示:
RES <- data.table(time = c(2, 3, 4, 5, 6, 10, 11, 12, 13, 14), b = c(0, 0, 1, 0, 0, 0, 0, 1, 0, 0))发布于 2020-10-29 23:29:28
这里有一个(快速而粗糙的)选项:
n <- 2L
DT[{rows <- rep(which(b==1), each = n*2L+1L) + -n:n; fifelse(rows %between% c(1,.N), rows, 0)}]
time b
1: 2 0
2: 3 0
3: 4 1
4: 5 0
5: 6 0
6: 10 0
7: 11 0
8: 12 1
9: 13 0
10: 14 0要在单独的data.frames中获得结果,可以使用lapply():
lapply(
DT[b==1, which=TRUE],
function(i) DT[{rows <- rep(i, each = n*2L+1L) + -n:n; fifelse(rows %between% c(1,.N), rows, 0)}]
)
# [[1]]
# time b
# 1: 2 0
# 2: 3 0
# 3: 4 1
# 4: 5 0
# 5: 6 0
#
# [[2]]
# time b
# 1: 10 0
# 2: 11 0
# 3: 12 1
# 4: 13 0
# 5: 14 0https://stackoverflow.com/questions/64593814
复制相似问题