我正在尝试理解如何在R的线性回归中使用分类变量。我有一些保险数据,它们具有覆盖类型(基本、扩展和保费)的分类变量。当我运行一个简单的线性回归时:
summary(lm(Customer.Lifetime.Value ~ Coverage, data = ins)) #basic sig but might not include
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 8498 2829 3.004 0.0198 *
Cove
在SAS中,有能力通过一个简单的if语句删除一个观察。例如,如果我想删除其中的年份= #的行。我可以写:
If year == "#" then delete;
在r中有类似的方法吗?我试过这个:
DF<- DF[!(DF$Year == "#"),]
R中的数据集:
Year Month
# June
# July
# August
2015 August
但是当我运行DF$year时,我仍然得到#作为一个因素水平,当我认为它会被过滤掉?