腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1131)
视频
沙龙
1
回答
causalml
包
:
随机
森林
可以
处理
连续
响应
变量
吗
?
、
、
Python有一个名为
causalml
的package,可用于隆起建模。我试图在
响应
变量
是
连续
的情况下模拟隆起。这个
包
中的决策树模块不能
处理
连续
的
响应
变量
,但是当我使用
随机
森林
模块时,它
可以
工作。我在documentation的某个地方看到,这个
包
中基于树的模块只针对分类问题而设计。我想知道这个
包
是否能
处理
连续
浏览 46
提问于2020-11-06
得票数 1
1
回答
学习
随机
森林
并与
连续
特征相匹配
有人知道python如何学习
随机
森林
实现如何在拟合过程中
处理
连续
变量
吗
?我很想知道它是否进行了任何类型的绑定(如果是的话,它是如何进行绑定的),还是
连续
变量
只是作为一个范畴
变量
来
处理
呢?
浏览 0
提问于2016-10-19
得票数 2
回答已采纳
1
回答
在具有
随机
效应的多
变量
丰度数据中使用什么统计方法?
、
我正在
处理
具有
随机
效果的多
变量
数据。我还有一个
随机
效应,R,它是一个因子
变量
。所以我的模型应该是这样的:A1andA2~D, random=1=~1|R 我尝试使用mvabund
包
中的函数manyglm,但它不能
处理
随机
效果。或者我
可以
使用lme4,但它不能
处理
多
变量
数据。我
可
浏览 0
提问于2018-06-30
得票数 1
2
回答
当使用
随机
森林
时,在scikit-learn中表示因子
变量
的方法是什么?
、
、
我正在使用
随机
森林
解决一个分类问题。为此,我决定使用Python库scikit-learn。但是我对
随机
森林
算法和这个工具都是新手。我的数据包含许多因子
变量
。我在谷歌上搜索了一下,发现像我们在线性回归中那样给因子
变量
赋予数值是不正确的,因为它会将其视为
连续
变量
并给出错误的结果。但是我在scikit-learn中找不到任何关于如何
处理
因子
变量
的东西。请告诉我要使用的选项,或者告诉我
可以
在哪里获得它的文
浏览 3
提问于2013-05-10
得票数 4
1
回答
在randomForest中训练和测试设置相同的
变量
而不是同一类
、
、
、
、
我已经使用R中的<code>D0</code>
包
使用训练集训练了一个
随机
森林
模型。训练集中的一个
变量
是character class,我将其转换为<code>D1</code>。但是,测试集中的相同
变量
仍然是character。但我惊讶地发现,我仍然
可以
从我训练的
随机
森林
模型中获得预测,即使该
变量
是一个字符类。我还发现,如果我还将测试集中的
变量
转换为
浏览 10
提问于2020-08-05
得票数 0
1
回答
多标签分类R
我有以下数据集,28个
变量
,其中5个是标签(Class, crown, root, trunk, collar)。首先,我尝试使用RandomForest根据类来预测树是否有病。接下来,我需要预测树的哪个部分病了(树冠、树根、树领、树干) 我需要使用多标签分类(randomForestSRC)或其他
包
。
浏览 5
提问于2017-06-04
得票数 0
1
回答
随机
森林
的数据准备与python的预测建模
、
、
、
我有大约350 K的训练例子,但我
可以
增加我的数据集的大小,如果需要。下面是我遇到的几个问题:3-选择模型本身:我正在考虑支持向量机、K-邻域、决策树、
随机
森林
、Logistic回归等几个方面,但我猜想,由于有大量的分类特征,
随
浏览 3
提问于2015-04-17
得票数 1
1
回答
如何
处理
虚拟功能
、
、
、
、
我想建立xgboost和
随机
森林
。我使用的
包
要求在xgboost构造中,应该创建伪
变量
。问题是,我是否应该使用虚拟集来构建两者?(即使
森林
可以
处理
计算并且不需要假人)?为了测试模型并进行比较,我还应该将训练集中的分类
变量
更改为虚拟
变量
,对
吗
?换句话说,我的训练集和测试集对于每个模型都必须是相同的?非常感谢您的帮助!
浏览 12
提问于2018-01-11
得票数 0
1
回答
获取R中
随机
林使用的
变量
目前,我在R中创建了一个
随机
森林
模型,名为:我正在尝试访问dataset中的
随机
林中使用的
变量
,但到目前为止,我访问了:我目前正在为我的
随机
森林
使用以下软件
包
。library(caret)
浏览 0
提问于2019-05-22
得票数 2
回答已采纳
1
回答
使用DEAP的多
变量
多目标优化
、
、
我试图优化仿真软件的两个输出(我使用
随机
森林
来训练一个快速预测输出的模型)。有七个输入
变量
,三个是
连续
的,其余的是离散的。我使用DEAP软件
包
进行多目标优化,但只有一个
变量
或一组相关
变量
(类似于背包)。上述七个
变量
是: estim = [1000, 1500, 2000] ft = [None, "rel"] min_s =
浏览 0
提问于2018-10-11
得票数 1
回答已采纳
1
回答
随机
林的混合预测类型
、
、
、
我试图建立一个使用
随机
森林
的分类模型,用于一个包含5个预测
变量
的数据集。两个预测
变量
是
连续
型的,一个
可以
是[0, 1000]区间中的实值,另一个
可以
是[-10, 10]的实值;一个预测
变量
是[10000, 15000]的整数值。另外,剩下的两个预测
变量
具有分类值,即{ A, B, C, D, E F}和{NY, LA, Chicago}。是否需要对这些不同的预测器类型进行预
处理
?
浏览 1
提问于2014-08-18
得票数 1
回答已采纳
2
回答
如何
处理
决策树,
随机
森林
的分类特征?
、
、
我试图在UCI银行营销数据-> 上建立决策树和
随机
森林
分类器。数据集中有许多分类特性(具有字符串值)。在spark文档中,
可以
通过使用StringIndexer或VectorIndexer索引将分类
变量
转换为数字
变量
。我的问题是,
随机
森林
或决策树算法如何理解新特征(从分类特征派生)与
连续
变量
不同。算法中是否认为索引特征是
连续
的?这是正确的做法
吗
?或者我应该继续对分类特性进行一次热编码。
浏览 6
提问于2017-07-06
得票数 5
回答已采纳
2
回答
R中回归模型的特征选择
、
、
我正在尝试在R中找到一个
可以
用于回归的特征选择
包
。大多数
包
使用
响应
变量
的因子或类来实现其分类方法。特别是,我感兴趣的是,是否有一种使用
随机
森林
的方法来实现这一目的。
浏览 1
提问于2015-03-19
得票数 0
2
回答
使用
随机
林创建二进制结果
、
、
我有一个如下所示的数据集: ADO Den Haag Groningen 1.5950 1.2672 1modFit <- train(Gewonnen~ EXPG1 + EXPG2, data=training, method="rf", prox=TRUE) 我现在不能做一个混乱的矩阵,因为我的数据有更
浏览 4
提问于2015-12-21
得票数 3
回答已采纳
2
回答
随机
森林
与神经网络的不同精度
、
、
、
、
我用神经网络模型和
随机
森林
模型运行了一组时间序列数据。对于神经网络,我将数据标准化,将其分为测试20%,验证和训练80%。对于
随机
森林
,我没有对数据进行标准化,测试列车的分割率分别为20%和80%,我在这里使用了scikit学习。我得到93%的精度.Here时间序列数据以及使用。难道我不应该得到与神经网络相似的精确度
吗
?
随机
森林
也能过关
吗
?我的一辆是不是太合适了?!
浏览 0
提问于2020-12-02
得票数 3
3
回答
从
随机
森林
中检索结果的概率
、
、
我在一个包含7个
变量
的大约1000个观测值的数据集上建立了一个
随机
森林
模型(使用
包
‘party’的cforest )。反应是二元的(比如结果A和结果B),6个预测因子都是绝对的。在后一种情况下,我们
可以
使用预测(您的模型,type=“
响应
”)来获得每个结果的概率,在这种情况下,结果A在p<0.5时是有利的,而结果B在p>=0.5时是有利的。似乎在对
随机
森林
对象应用预测时,我只得到每个观测的预测结果(即A或B)。是否有办法来检索预测
响
浏览 2
提问于2017-04-20
得票数 0
回答已采纳
1
回答
随机
森林
:对于一系列值(不是二进制阈值)中的特性,它的效率如何?
每个特性只在一个决策树中使用一次,这是正确的
吗
?然后,如果一个特征(对分类最具决定性意义)决定了一个值范围的分类,该算法能以任何方式检测到这一点,或者它会失败
吗
?更清楚的是,我们
可以
说,分类是把人归类为青少年。那么行列式特征将是年龄,如果这个特征在12到18之间,分类就会是。所以我们没有一个阈值(age<12)或(age>18),而是两个。在这种情况下,
随机
森林
算法能成功
吗
? 谢谢你的建议
浏览 0
提问于2020-11-24
得票数 1
回答已采纳
1
回答
not NC无助于对我的混合
连续
/分类数据集进行过采样。
、
、
我的数据集中有32个分类
变量
和30个
连续
变量
。所有的分类
变量
已被转换为二进制列使用一热编码。此外,在进行过采样
处理
之前,我将使用Iterativeimputer计算所有缺失的值。关于分类器,我使用的是logistic回归,
随机
森林
和XGboost。能告诉我你对这个的想法
吗
?对多类和高度不平衡的数据集进行过度抽样有任何建议
吗
?
浏览 0
提问于2019-08-09
得票数 0
1
回答
分类后再用回归
处理
通常为零的
响应
变量
、
、
我有一个数据集,由一组预测器(大部分是无界或正实数)和一个我希望预测的
响应
变量
组成。反应通常是零的--大约90%的时间。我尝试过用标准的高斯过程方法以及
随机
森林
来模拟这个问题。然而,在这两种情况下(尽管在使用
随机
森林
时大多数情况下),模型似乎
处理
数据很差,通常预测非零
响应
。现在,如果预测的
响应
实际上非常接近于零,我
可以
设置一个截断值,在此以下值将被舍入为零,但在许多情况下,它们是明显非零的。我的解决方案是训练两个模型
浏览 0
提问于2017-04-18
得票数 1
回答已采纳
1
回答
具有p>>n和内存不足的
随机
林
、
、
我试图用200 K的预测器和20行的数据对基因组数据进行
随机
森林
分类。预测器已经被修剪,以便进行自相关。我尝试使用'ranger‘R
包
,但是它抱怨它不能分配164 to向量(我确实有32 to的RAM)。 是否有任何RF实现
可以
管理在可用内存中的分析(我希望避免增加交换空间)?是否应该使用不同的算法(对于我所读到的,RF应该
处理
好p>>n)?
浏览 3
提问于2022-03-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于随机森林的分类与回归
这种机器学习算法已经在微生物分析中成功应用
python机器学习—随机森林算法:RandomForest
九道门丨如何使用随机森林进行时间序列预测?
随机森林原理介绍与适用情况(综述篇)
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券