计算R中范围内的数值

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (36)

我想比较ra,它给出了范围(例如,时间)ev,并且表示事件发生的时间。

我想在一个新专栏hitsra说明每个范围内发生了多少事件。

ra <- data.frame(a=c(0, 250, 500, 750), b=c(250, 500, 750, 900))
ra
    a   b
1   0 250
2 250 500
3 500 750
4 750 900

ev <- data.frame(events=c(1,1,1,1,1), time=c(100, 200, 450, 550, 600))
ev
  events time
1      1  100
2      1  200
3      1  500
4      1  550
5      1  600

这就是结果应该是什么样子。

data.frame(a=c(0, 250, 500, 750), b=c(250, 500, 750, 900), hits=c(2,1,2,0))
    a   b hits
1   0 250    2
2 250 500    1
3 500 750    2
4 750 900    0
提问于
用户回答回答于
ra$hits <- mapply(function(a, b) with(ev, sum(events[time > a & time < b])),
                  ra$a,ra$b)

ra
#     a   b hits
# 1   0 250    2
# 2 250 500    1
# 3 500 750    2
# 4 750 900    0

与tidyverse类似的解决方案:

library(tidyverse)
ra$hits <- 
  pmap(ra, ~ ev %>% summarise(sum(events[between(time, .x, .y)]))) %>% 
    unlist

或者,使用与arg0naut和akrun的答案类似的逻辑但是在纯SQL中(与上面相同的结果)

library(sqldf)
ra$hits <- 
  sqldf('
  select    coalesce(sum(events), 0) as hits
  from      ra
            left join ev
              on ev.time > ra.a and ev.time < ra.b
  group by  ra.a
            , ra.b
  ')[[1]]
用户回答回答于

能做:

library(tidyverse)

crossing(ra, ev) %>%
  group_by(a, b) %>%
  summarise(hits = sum(between(time, a, b)))

输出:

# A tibble: 4 x 3
# Groups:   a [4]
      a     b  hits
  <dbl> <dbl> <int>
1     0   250     2
2   250   500     1
3   500   750     2
4   750   900     0

所属标签

可能回答问题的人

  • HKC

    红客学院 · 创始人 (已认证)

    26 粉丝7 提问5 回答
  • 西风

    renzha.net · 站长 (已认证)

    9 粉丝1 提问4 回答
  • Dingda

    Dingda · 站长 (已认证)

    4 粉丝0 提问3 回答
  • 螃蟹居

    1 粉丝0 提问2 回答

扫码关注云+社区

领取腾讯云代金券