causalml包:随机森林可以处理连续响应变量吗？

、、

Python有一个名为causalml的package，可用于隆起建模。我试图在响应变量是连续的情况下模拟隆起。这个包中的决策树模块不能处理连续的响应变量，但是当我使用随机森林模块时，它可以工作。我在documentation的某个地方看到，这个包中基于树的模块只针对分类问题而设计。我想知道这个包是否能处理连续

浏览 46提问于2020-11-06得票数 1

1回答

学习随机森林并与连续特征相匹配

有人知道python如何学习随机森林实现如何在拟合过程中处理连续变量吗？我很想知道它是否进行了任何类型的绑定(如果是的话，它是如何进行绑定的)，还是连续变量只是作为一个范畴变量来处理呢？

浏览 0提问于2016-10-19得票数 2

回答已采纳

1回答

在具有随机效应的多变量丰度数据中使用什么统计方法？

、

我正在处理具有随机效果的多变量数据。我还有一个随机效应，R，它是一个因子变量。所以我的模型应该是这样的：A1andA2~D, random=1=~1|R 我尝试使用mvabund包中的函数manyglm，但它不能处理随机效果。或者我可以使用lme4，但它不能处理多变量数据。我可

浏览 0提问于2018-06-30得票数 1

2回答

当使用随机森林时，在scikit-learn中表示因子变量的方法是什么？

、、

我正在使用随机森林解决一个分类问题。为此，我决定使用Python库scikit-learn。但是我对随机森林算法和这个工具都是新手。我的数据包含许多因子变量。我在谷歌上搜索了一下，发现像我们在线性回归中那样给因子变量赋予数值是不正确的，因为它会将其视为连续变量并给出错误的结果。但是我在scikit-learn中找不到任何关于如何处理因子变量的东西。请告诉我要使用的选项，或者告诉我可以在哪里获得它的文

浏览 3提问于2013-05-10得票数 4

1回答

在randomForest中训练和测试设置相同的变量而不是同一类

、、、、

我已经使用R中的<code>D0</code>包使用训练集训练了一个随机森林模型。训练集中的一个变量是character class，我将其转换为<code>D1</code>。但是，测试集中的相同变量仍然是character。但我惊讶地发现，我仍然可以从我训练的随机森林模型中获得预测，即使该变量是一个字符类。我还发现，如果我还将测试集中的变量转换为

浏览 10提问于2020-08-05得票数 0

1回答

多标签分类R

我有以下数据集，28个变量，其中5个是标签(Class, crown, root, trunk, collar)。首先，我尝试使用RandomForest根据类来预测树是否有病。接下来，我需要预测树的哪个部分病了(树冠、树根、树领、树干) 我需要使用多标签分类(randomForestSRC)或其他包。

浏览 5提问于2017-06-04得票数 0

1回答

随机森林的数据准备与python的预测建模

、、、

我有大约350 K的训练例子，但我可以增加我的数据集的大小，如果需要。下面是我遇到的几个问题：3-选择模型本身:我正在考虑支持向量机、K-邻域、决策树、随机森林、Logistic回归等几个方面，但我猜想，由于有大量的分类特征，随

浏览 3提问于2015-04-17得票数 1

1回答

如何处理虚拟功能

、、、、

我想建立xgboost和随机森林。我使用的包要求在xgboost构造中，应该创建伪变量。问题是，我是否应该使用虚拟集来构建两者？(即使森林可以处理计算并且不需要假人)？为了测试模型并进行比较，我还应该将训练集中的分类变量更改为虚拟变量，对吗？换句话说，我的训练集和测试集对于每个模型都必须是相同的？非常感谢您的帮助！

浏览 12提问于2018-01-11得票数 0

1回答

获取R中随机林使用的变量

目前，我在R中创建了一个随机森林模型，名为：我正在尝试访问dataset中的随机林中使用的变量，但到目前为止，我访问了：我目前正在为我的随机森林使用以下软件包。library(caret)

浏览 0提问于2019-05-22得票数 2

回答已采纳

1回答

使用DEAP的多变量多目标优化

、、

我试图优化仿真软件的两个输出(我使用随机森林来训练一个快速预测输出的模型)。有七个输入变量，三个是连续的，其余的是离散的。我使用DEAP软件包进行多目标优化，但只有一个变量或一组相关变量(类似于背包)。上述七个变量是： estim = [1000, 1500, 2000] ft = [None, "rel"] min_s =

浏览 0提问于2018-10-11得票数 1

回答已采纳

1回答

随机林的混合预测类型

、、、

我试图建立一个使用随机森林的分类模型，用于一个包含5个预测变量的数据集。两个预测变量是连续型的，一个可以是[0, 1000]区间中的实值，另一个可以是[-10, 10]的实值；一个预测变量是[10000, 15000]的整数值。另外，剩下的两个预测变量具有分类值，即{ A, B, C, D, E F}和{NY, LA, Chicago}。是否需要对这些不同的预测器类型进行预处理？

浏览 1提问于2014-08-18得票数 1

回答已采纳

2回答

如何处理决策树，随机森林的分类特征？

、、

我试图在UCI银行营销数据-> 上建立决策树和随机森林分类器。数据集中有许多分类特性(具有字符串值)。在spark文档中，可以通过使用StringIndexer或VectorIndexer索引将分类变量转换为数字变量。我的问题是，随机森林或决策树算法如何理解新特征(从分类特征派生)与连续变量不同。算法中是否认为索引特征是连续的？这是正确的做法吗？或者我应该继续对分类特性进行一次热编码。

浏览 6提问于2017-07-06得票数 5

回答已采纳

2回答

R中回归模型的特征选择

、、

我正在尝试在R中找到一个可以用于回归的特征选择包。大多数包使用响应变量的因子或类来实现其分类方法。特别是，我感兴趣的是，是否有一种使用随机森林的方法来实现这一目的。

浏览 1提问于2015-03-19得票数 0

2回答

使用随机林创建二进制结果

、、

我有一个如下所示的数据集： ADO Den Haag Groningen 1.5950 1.2672 1modFit <- train(Gewonnen~ EXPG1 + EXPG2, data=training, method="rf", prox=TRUE) 我现在不能做一个混乱的矩阵，因为我的数据有更

浏览 4提问于2015-12-21得票数 3

回答已采纳

2回答

随机森林与神经网络的不同精度

、、、、

我用神经网络模型和随机森林模型运行了一组时间序列数据。对于神经网络，我将数据标准化，将其分为测试20%，验证和训练80%。对于随机森林，我没有对数据进行标准化，测试列车的分割率分别为20%和80%，我在这里使用了scikit学习。我得到93%的精度.Here时间序列数据以及使用。难道我不应该得到与神经网络相似的精确度吗？随机森林也能过关吗？我的一辆是不是太合适了？！

浏览 0提问于2020-12-02得票数 3

3回答

从随机森林中检索结果的概率

、、

我在一个包含7个变量的大约1000个观测值的数据集上建立了一个随机森林模型(使用包‘party’的cforest )。反应是二元的(比如结果A和结果B)，6个预测因子都是绝对的。在后一种情况下，我们可以使用预测(您的模型，type=“响应”)来获得每个结果的概率，在这种情况下，结果A在p<0.5时是有利的，而结果B在p>=0.5时是有利的。似乎在对随机森林对象应用预测时，我只得到每个观测的预测结果(即A或B)。是否有办法来检索预测响

浏览 2提问于2017-04-20得票数 0

回答已采纳

1回答

随机森林:对于一系列值(不是二进制阈值)中的特性，它的效率如何？

每个特性只在一个决策树中使用一次，这是正确的吗？然后，如果一个特征(对分类最具决定性意义)决定了一个值范围的分类，该算法能以任何方式检测到这一点，或者它会失败吗？更清楚的是，我们可以说，分类是把人归类为青少年。那么行列式特征将是年龄，如果这个特征在12到18之间，分类就会是。所以我们没有一个阈值(age<12)或(age>18)，而是两个。在这种情况下，随机森林算法能成功吗？谢谢你的建议

浏览 0提问于2020-11-24得票数 1

回答已采纳

1回答

not NC无助于对我的混合连续/分类数据集进行过采样。

、、

我的数据集中有32个分类变量和30个连续变量。所有的分类变量已被转换为二进制列使用一热编码。此外，在进行过采样处理之前，我将使用Iterativeimputer计算所有缺失的值。关于分类器，我使用的是logistic回归，随机森林和XGboost。能告诉我你对这个的想法吗？对多类和高度不平衡的数据集进行过度抽样有任何建议吗？

浏览 0提问于2019-08-09得票数 0

1回答

分类后再用回归处理通常为零的响应变量

、、

我有一个数据集，由一组预测器(大部分是无界或正实数)和一个我希望预测的响应变量组成。反应通常是零的--大约90%的时间。我尝试过用标准的高斯过程方法以及随机森林来模拟这个问题。然而，在这两种情况下(尽管在使用随机森林时大多数情况下)，模型似乎处理数据很差，通常预测非零响应。现在，如果预测的响应实际上非常接近于零，我可以设置一个截断值，在此以下值将被舍入为零，但在许多情况下，它们是明显非零的。我的解决方案是训练两个模型

浏览 0提问于2017-04-18得票数 1

回答已采纳

1回答

具有p>>n和内存不足的随机林

、、

我试图用200 K的预测器和20行的数据对基因组数据进行随机森林分类。预测器已经被修剪，以便进行自相关。我尝试使用'ranger‘R包，但是它抱怨它不能分配164 to向量(我确实有32 to的RAM)。是否有任何RF实现可以管理在可用内存中的分析(我希望避免增加交换空间)？是否应该使用不同的算法(对于我所读到的，RF应该处理好p>>n)?

浏览 3提问于2022-03-07得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

学习随机森林并与连续特征相匹配

在具有随机效应的多变量丰度数据中使用什么统计方法？

当使用随机森林时，在scikit-learn中表示因子变量的方法是什么？

在randomForest中训练和测试设置相同的变量而不是同一类

多标签分类R

随机森林的数据准备与python的预测建模

如何处理虚拟功能

获取R中随机林使用的变量

使用DEAP的多变量多目标优化

随机林的混合预测类型

如何处理决策树，随机森林的分类特征？

R中回归模型的特征选择

使用随机林创建二进制结果

随机森林与神经网络的不同精度

从随机森林中检索结果的概率

随机森林:对于一系列值(不是二进制阈值)中的特性，它的效率如何？

not NC无助于对我的混合连续/分类数据集进行过采样。

分类后再用回归处理通常为零的响应变量

具有p>>n和内存不足的随机林

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐