基于 this stackoverflow topic,我想提取系数。
在“钻石”数据集中,我使用nest()函数将钻石数据集分成两个分类变量: color和cut。然后,对于每个模型,计算系数和r_square,并将它们存储为数据帧。
我通过以下代码成功地做到了这一点:
df_dia <- diamonds %>%
group_by(color, cut) %>% nest() %>%
# generate summary
mutate(fit = map(data, ~lm(price ~ carat, data=.)), summary= map(fit, glance)) %>%
unnest(summary) %>%
# generate coef
mutate(fit = map(data, ~lm(price ~ carat, data=.) %>%coef %>%
as.list %>% as_tibble)) %>%
unnest(fit) %>% unnest(data) %>%
select(color, cut, `(Intercept)`, carat, r.squared)
然而,它的效率并不高,因为它必须进行2次回归。有没有更好的办法?
https://stackoverflow.com/questions/55785211
复制相似问题