我有一个数据框,我想按用户分组,并求出数量的总和。
library(data.table)
x = read.table('C:/Users/user/Desktop/20180911_Dataset_b.csv',encoding = 'UTF-8',sep =',')
dt = data.table(x)
colnames(dt)
"dates_d" "user" "proj" "quantity"
列quantity
如下所示:
quantity
1
34
12
13
3
12
-
11
1
我听说data.table library
非常快,所以我想用它。
我用Python写过,但不知道怎么用R写。
发布于 2018-09-13 17:29:46
library(dplyr)
dt[dt == "-" ] = NA
df <- dt %>% group_by(user) %>%
summarise(qty = sum(!is.na(quantity)))
https://stackoverflow.com/questions/52310642
复制相似问题