我想知道如何在两个或多个因素变量的水平组合上执行多个独立的线性回归。
假设我们的数据集有一个相依连续变量,然后是两个因子自变量和一个连续自变量。
那么,假设r中的回归公式是这样的:
model <- lm(weight ~ city + diet + height)
或者,用伪代码编写,我尝试这样做:lm(weight ~ height) %>% group by city lm(weight ~ height) %>% group by diet lm(weight ~ height) %>% group by city & diet
我知道我们可以对每个城市
我必须为集群标准误差调整logistic回归模型。为此,我使用包ClusterSEs和命令cluster.im。
我必须在数据集Tbf2:个人和村庄: Tbf2是我的小型数据集,它由变量Burned (二进制变量;村庄级别)、Tbf2(因子,村庄级别)和VoteForER2 (二进制,个人级别)组成。
我的代码如下:
#Make sure the data has the same length,
Tbf1 <- data.frame(cbind(Burned, Village, VoteForER2))
Tbf2 <- na.omit(Tbf1)
#Prediction of
如何从堆叠集成模式访问基本分类器的值?我用了滑雪的StackingClassifier。
当我实施时:
model.final_estimator_.decision_function(X_train)
我发现了一个错误:
X has 10 features, but LinearRegression is expecting 4 features as input.
我有一个堆叠的合奏模型,里面有:
基于classiferLinear回归的决策树、线性回归、XGB和MLP作为元分类器
我只是好奇如何才能访问从基分类器传递给元辅助符的内容
我想对不同的国家进行同样的回归(即我的数据子集)。我确实想出了在R中怎么做,但是在Stata做了同样的事情之后,我想知道在R中是否有更好的方法。
在斯塔塔,你会做这样的事情:
foreach country in USA UK France {
reg y x1 x2 if country == "`country'"
}
简单可读的,对吧?在R中,我提出了分裂和蹒跚的方法,两者都比较复杂。使用split
data.subset <- split(data, data$country)[c("USA", "UK", "
我是R的新手,正在尝试按组循环回归。对于我的数据,我有13个组,并希望创建13个对象--每个组的回归结果,这样我就可以将所有回归结果放在一个表中。以下是我尝试过的方法: for (i in 1:13) {groupi = lm(Yvariable ~ Xvariables,
data = dataset,
subset = dataset$group== i )} 因此,我将有13个组‘i’对象,每个对象都是要放入表中的回归结果。谢谢!