我有一个数据框架,它有一个名为“拖欠?”的变量。答案是“是”、“否”或“零”。另一个变量叫做Trade,它列出了不同的行业,如电气、管道等。我想计算一下拖欠和不拖欠时调用多少个电子行业(我想对每个行业这样做,我认为总共有18个行业)。我一直在与总量作斗争,所以我决定:
将数据帧拆分为2,一个拖欠?=是,另一个拖欠?=否或零。
如何使用字符变量进行此操作?我以前用数值变量做过这件事,它工作得很好,但在字符变量上找不到多少信息。例如,如何做"if variable =“yes”之类的事情。
发布于 2017-04-19 08:57:50
样本数据:
dat = data.frame(trade = sample(letters[1:5],30,replace=TRUE),
arrears = sample(c("yes","no","0"),30,replace=TRUE))使用dplyr的group_by根据您的条件聚合和summarise数据:
require(dplyr)
dat %>% group_by(trade) %>%
summarise(no = length(arrears[arrears%in%c("no","0")]),
yes = length(arrears[arrears=="yes"]))https://stackoverflow.com/questions/43490665
复制相似问题