比较来自多个模型的回归模型系数的森林小区刻面网格

、、、、

我目前正在使用30个数据集，它们具有相同的列名，但不同的数字数据。我需要将线性混合模型和广义线性模型应用于数据集的每个实例，并在森林地块上绘制产生的固定影响系数。当前数据的结构如下(为简单起见，对每个列表元素使用相同的数据集)： library(lme4) # There's definitely a better way这需要大量的时间，

浏览 18提问于2021-11-11得票数 0

回答已采纳

1回答

如何为分类模型选择正确的预测器？

、、、、

我有两个模特：随机森林模型So，应该使用哪些方法来选择正确的预测器，以便比较这两个模型？谢谢

浏览 0提问于2021-08-19得票数 0

1回答

随机森林回归中的树木数量

、

我正在学习随机森林回归模型。我知道它形成了许多树(模型)，然后我们可以通过平均所有树的结果来预测我们的目标变量。我对决策树回归算法也有一定的了解。我们怎样才能形成最佳的树木数量呢？例如，我有一个数据集，其中我正在预测人员工资，而我只有两个输入变量，分别是“经验年限”和“绩效得分”，那么使用这样的数据集我可以形成多少随机树？随机森林树依赖于输入变量的数量吗？任何好的

浏览 127提问于2019-06-08得票数 1

1回答

如何使用插入符号比较不同的模型，调整不同的参数？

、、、、

我试图实现一些函数来比较五种不同的机器学习模型来预测回归问题中的一些值。我的意图是做一套功能，可以训练不同的代码，并将它们组织成一系列的结果。通过实例选择的模型有: Lasso模型、随机森林模型、SVM模型、线性模型和神经网络模型。为了调优某些模型，我打算使用Max：的引用

浏览 1提问于2019-02-11得票数 1

1回答

如何比较监督学习算法及其技术集成学习算法？

、、、、

我不得不比较支持向量机和随机森林算法，但是我搞不懂如何比较它，比如支持向量机是监督学习算法，随机森林是集合学习算法。帮助我如何比较它在哪一点上像-在分类，在回归。

浏览 0提问于2020-04-17得票数 0

回答已采纳

1回答

编辑Stata coefplot中的置信区间

、

我在Stata中使用coefplot命令来绘制来自多个回归模型的系数和置信区间。我绘制了4个不同型号规格的相同系数(X)。有一个模型规范(替代标准误差)，我不知道如何在Stata中估计，但可以使用R进行估计。这意味着对于一个模型规范，我在R中有标准误差，但在Stata中没有。有没有一种简单的方法来手动修改coefplot中的标准误差？我的代码是： coefplot

浏览 472提问于2021-04-29得票数 2

回答已采纳

1回答

我应该使用哪个Scikit学习应用程序来处理我的数据？(Python)

、、

我正在编写一个程序，将需要大量的数据，如叶绿素水平，水温，氮/磷水平等，以预测藻类在水体中的生长。影响藻类生长的因素很多。因此，我不知道我应该在Scikit学习库中使用哪个应用程序来容纳所有不同的列。具体来说，还有17列我想说明(其中一半是标识符，如果数据可能是不正确的)。我应该使用什么来解释所有的列？

浏览 0提问于2021-11-30得票数 2

1回答

学习特征选择停止准则(SelectFromModel)

、、

Sklearn有几个用于特征选择的功能，可以让用户确定所选子集的大小。这方面的一个例子是SelectKBest，其中用户确定"k“的值，这是性能最好的特性的数量。

浏览 0提问于2016-07-15得票数 0

回答已采纳

2回答

属性对Python中特定目标的预测能力，使用Sklearn中的特性选择

、、、、

Scikit-Learn (或一般的algos )中是否有任何特征选择方法给出了属性预测特定目标的能力/预测能力/重要性的权重?例如from sklearn.datasets import load_iris，将4个属性的权重分别排序以分别预测3个虹膜物种，但对于更为复杂的数据集w/ ~1k-10k属性进行排序。我正在寻找类似于feature_importances_的。然而，RandomForestClassifer为整个预测过程的每个属性赋予权重。首先，

浏览 3提问于2016-11-23得票数 9

1回答

gridSearch性能测量效应

、、

我有一个任务，它要求我：使用超参数调优从前面的步骤中改进模型的性能，并根据您选择的度量(或度量)使用网格搜索来选择最终的最优模型。选择一个给定任务的最优模型(在特定领域上比较多个回归者)需要选择性能度量，例如，R2(确定系数)和/或RMSE (根均方误差)来比较模型的性能。cv=2,scoring='r2

浏览 0提问于2019-03-14得票数 0

3回答

超参数整定与分类算法的比较

、、、、

对于分类算法的比较，我有一个疑问。我正在做一个关于数据集的超参数调优和分类模型比较的项目。我们的目标是为我的数据集找出最适合我的超参数的模型。例如:我有两个分类模型(支持向量机和随机森林)，我的数据集有1000行和10列(9列是特性)，最后一列是可分层的。在此基础上，利用CV = 10的网格

浏览 0提问于2020-12-31得票数 0

回答已采纳

1回答

R中随机森林回归模型的corr.bias参数

、、、

我在R中使用随机森林的回归模型，我发现参数corr.bias根据手册是“实验性的”，我的数据是非线性的，我只是想知道将这个参数设置为true是否可以增强结果，另外我不知道它对非线性数据是如何工作的，所以如果有人能解释一下这个校正偏差在随机森林包中是如何工作的，以及它是否可以增强我的回归模型，我真的很感激。

浏览 3提问于2013-07-24得票数 3

1回答

GLMMadaptive (R)中的零膨胀两部分模型:关于固定效应零部分？

、、

我使用R中的GLMMadaptive包运行一个障碍对数正态模型，连续部分和零部分都有固定效果中定义的范畴变量。我想对这些分类变量进行一次方差分析，以判断是否存在主要影响。我已经看到，使用glmmTMB包，您可以分别对条件模型和零部分模型分别运行ANOVA，就像演示的那样。是否有类似的策略可用于GLMMadaptive包？(据我所知，glmmTMB不支持障碍对数模型)。也许使用来自emmeans包的joint_tests函数？如果是这

浏览 7提问于2021-02-10得票数 1

回答已采纳

1回答

元from提供了与原始值不同的95%CI。

、

我使用元数据包组合线性回归模型中的β系数。我使用了以下代码。我为rma函数提供了报告的se和beta值。但是，当我看到森林地块时，95%的置信区间与研究报告中的不同。我还通过运行三个模型并结合系数，使用mtcar数据集进行了尝试。尽管如此，我们在森林地块上看到的95%CI仍与原始模型不同。这些偏差远非四舍五入的误差。下面是一个可重复的</

浏览 8提问于2022-02-24得票数 1

回答已采纳

1回答

coefplot:几个模型，每个模型在一个图中有几个系数

、

我想要显示两个回归的系数(以及它们的置信区间)。使用Ben Jann的nice coefplot (ssc install coefplot)，我可以创建一个只有一个子图的图，其中包含来自所有模型的所有系数，但我不能成功地按模型而不是按系数对系数进行排序或者，我可以通过系数创建一个包含多个子图的图，这不是我所需

浏览 10提问于2017-04-20得票数 2

1回答

特征中的共线性和多重共线性？

、、、

数据科学家/ML工程师最常用的检测特征之间共线性(或)多重共线性的一些先进或基本方法是什么？

浏览 0提问于2019-03-18得票数 0

5回答

从K折交叉验证中选择哪个模型

、、、、

我读到了关于交叉验证以及如何使用它来选择最佳模型和估计参数的内容，我并不真正理解它的含义。假设我建立了一个线性回归模型，并进行了10折交叉验证，我认为这10个模型中的每一个都会有不同的系数值，现在我应该选择10个不同的系数值作为我的最终模型或估计参数。或者，我们使用交叉验证的目的只是为了找到平均误差(在我们的情况下，平均为10个

浏览 3提问于2017-08-03得票数 2

1回答

如何计算ML问题上的概率而不是实际分类

、、

每一行由4个以布尔值表示的列(特性)组成。第5列表示类，它还接受布尔值。下面是一个例子(它们几乎是随机的)：0,1,1,0,10,0,0,0,00,0,0,0,0 现在，我想要做的是建立一个模型，这样对于任何给定的输入(新行)，系统都不会返回类本身(就像在常规分类问题中那样)，而是这个特定输入属于0类或1类的概率。更重要的是，如何生成与该计算相关的置信区间或错误率？

浏览 4提问于2014-06-17得票数 0

回答已采纳

2回答

Logistic回归模型&R中范畴变量的多重性

、、、

我创建了一个逻辑回归模型如下：然而，我想减少进入模型的自变量的数量，也许减少到20个左右有人能解释一下如何确定哪些范畴变量是共线性的，以及我在从模型中删除变量时应该使用的阈值吗？谢谢!

浏览 0提问于2014-05-04得票数 0

1回答

在对回归算法进行特征选择时，我选择了多少个特征？R2和RMSE是衡量过度适应成功的好方法吗？

、、、、

上下文:我目前正在制作和比较机器学习模型，以预测住房数据。我有大约32000个数据点，42个特征，我正在预测房价。我比较随机森林回归，决策树回归和线性回归。我可以看出存在一些过度拟合的情况，因为我的初始值与交叉验证值之间的关系如下： RF: 10倍R平方= 0.758，neg RMSE = -540.2 vs未验证的R平方为0.877，RMSE为505.6LR: 10倍R平方= 0.695，neg

浏览 0提问于2021-01-14得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何为分类模型选择正确的预测器？

随机森林回归中的树木数量

如何使用插入符号比较不同的模型，调整不同的参数？

如何比较监督学习算法及其技术集成学习算法？

编辑Stata coefplot中的置信区间

我应该使用哪个Scikit学习应用程序来处理我的数据？(Python)

学习特征选择停止准则(SelectFromModel)

属性对Python中特定目标的预测能力，使用Sklearn中的特性选择

gridSearch性能测量效应

超参数整定与分类算法的比较

R中随机森林回归模型的corr.bias参数

GLMMadaptive (R)中的零膨胀两部分模型:关于固定效应零部分？

元from提供了与原始值不同的95%CI。

coefplot:几个模型，每个模型在一个图中有几个系数

特征中的共线性和多重共线性？

从K折交叉验证中选择哪个模型

如何计算ML问题上的概率而不是实际分类

Logistic回归模型&R中范畴变量的多重性

在对回归算法进行特征选择时，我选择了多少个特征？R2和RMSE是衡量过度适应成功的好方法吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐