腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在scikit-learn中使用
python
生成器
python
、
generator
、
scikit-learn
、
random-forest
我想知道是否有可能以及如何使用
python
生成器作为
数据
输入到scikit learn分类器
的
.fit()函数?由于有大量
的
数据
,这对我来说似乎是有意义
的
。 具体地说,我即将实现一个
随机
森林
方法。
浏览 3
提问于2014-01-06
得票数 4
1
回答
在scikit-learn中平均多个
随机
森林
模型
python
、
machine-learning
、
scikit-learn
、
random-forest
我有一个非常
大
的
数据
集
,我想在
数据
集
的
分区
上
训练
几个
随机
的
森林
模型,然后对这些模型进行平均,以得出我
的
最终分类器。由于
随机
森林
是一种集成方法,这是一种直观
上
合理
的
方法,但我不确定是否可以使用scikit-learn
的
随机
森林
分类器。有什么想
浏览 0
提问于2017-12-23
得票数 1
3
回答
梯度增强vs
随机
林
machine-learning
、
random-forest
、
xgboost
根据我
的
理解,RF
随机
选择功能,因此很难过火。但是,在滑雪板
上
,梯度提升也提供了max_features
的
选项,可以帮助防止过度拟合。那么,为什么有人会使用
随机
森林
?谁能解释什么时候使用梯度增强与
随机
森林
基于给定
的
数据
? 任何帮助都是非常感谢
的
。
浏览 11
提问于2017-09-13
得票数 3
0
回答
WEKA on large training dataset (java代码)
java
、
classification
、
weka
我
的
训练
数据
集
有56000个实例和1253个特征。我正在使用简单
的
分类算法,
如
逻辑回归,J48,
随机
森林
随机
树等。我只能得到
随机
森林
的
结果。在为其他分类器建立
训练
模型
的
同时,我
的
程序持续运行了6-7个小时,但我没有得到任何结果或错误。 谁能建议一些更快
的
方法来在大
数据
集
<em
浏览 7
提问于2016-07-10
得票数 0
1
回答
基于分类列
的
连续变量预测
pandas
、
python-3.x
我有一个
大
的
数据
集
(40百万行,50列),其中大部分是分类列(有些是数字
的
),我使用
Python
/Pandas。分类栏有多达3000个独特
的
标签。 我正在寻找关于如何处理这个问题
的
最佳实践。显然,单热编码(OHE)是不可能
的
。我试着做了较小数量
的
分类,并以这种方式做OHE,但模型是非常糟糕
的
,许多信息正在丢失。此外,记忆是一个问题,一切都需要很长时间。在这种情况下,我应该对
数据</
浏览 0
提问于2022-03-21
得票数 0
1
回答
对于严重
的
缺失,对
随机
森林
的
可用子集
的
归责与
训练
有什么好处?
random-forest
、
prediction
、
missing-data
、
imputation
我想在一个
数据
集
上
训练
一个
随机
森林
模型。我知道“标准方法”,我们将丢失
的
数据
归算在
训练
集中,使用相同
的
估算规则对测试
集
进行计算,然后在所估算
的
训练
集
上
训练
随机
森林
模型,并使用相同
的
模型对测试
集
进行预测(可能需要多次估算)。我想要理解
浏览 3
提问于2020-04-12
得票数 1
1
回答
机器学习查询
python
、
validation
、
machine-learning
、
hyperparameters
“
训练
集
用于计算机器学习模型
的
参数,验证
数据
用于计算同一模型
的
超参数(我们使用相同
的
权重,不同
的
超参数),测试
集
用于评估我们
的
模型”。如果是真的,有人能更详细地解释一下整个过程吗?蒂娅。
浏览 26
提问于2018-06-07
得票数 -4
回答已采纳
1
回答
有可能提取经过
训练
的
ML模型
的
数学表达式吗?
python
、
r
、
machine-learning-model
、
mathematics
在
Python
& R
中
,线性回归模型在学习
训练
数据
后给出了数学表达式,通常以截距、变量系数和p值/t值
的
形式表示。在
训练
数据
集
上
对复杂模型进行
训练
后,可以提取基于决策树、
随机
森林
、XGBoost等复杂模型
的
数学表示吗?
浏览 0
提问于2022-11-11
得票数 1
1
回答
随机
森林
回归中
的
树木数量
machine-learning
、
random-forest
我正在学习
随机
森林
回归模型。我知道它形成了许多树(模型),然后我们可以通过平均所有树
的
结果来预测我们
的
目标变量。我对决策树回归算法也有一定
的
了解。我们怎样才能形成最佳
的
树木数量呢?例如,我有一个
数据
集
,其中我正在预测人员工资,而我只有两个输入变量,分别是“经验年限”和“绩效得分”,那么使用这样
的
数据
集
我可以形成多少
随机
树?
随机
森林
树依赖于输入变量
浏览 127
提问于2019-06-08
得票数 1
1
回答
有没有一种方法可以用决策树/
随机
森林
进行迁移学习?
python
、
scikit-learn
、
random-forest
、
decision-tree
有没有一种方法可以用决策树或
随机
森林
模型进行迁移学习?具体地说,我想知道在
Python
语言中是否有一种好
的
简单
的
方法来实现这一点,使用Scikit-learn
训练
的
模型。我所能想到
的
就是在原始
数据
集
上
训练
一个
随机
森林
,当新
数据
到达时,
训练
新
的
树并将其添加到您
的
模型
中<
浏览 340
提问于2021-05-11
得票数 3
1
回答
重复K次交叉验证对
随机
森林
有意义吗?
machine-learning
、
random-forest
、
cross-validation
当使用
随机
森林
时,使用常规交叉验证和仅取不同
随机
状态
的
多个模型
的
平均结果会给出与重复
的
K倍交叉验证相同
的
结果吗? 重复
的
K倍交叉验证基本
上
重复交叉验证与多个不同
的
分裂
数据
和报告
的
平均结果。
浏览 0
提问于2021-03-23
得票数 0
回答已采纳
2
回答
如何将分类
数据
类型用于
随机
森林
分类?
python
、
scikit-learn
、
data-mining
、
random-forest
我需要使用
随机
森林
算法来寻找
训练
数据
集
的
准确性。但是我
的
数据
集
的
类型是分类
的
和数字
的
。当我试图拟合这些
数据
时,我得到了一个错误。“'Input包含NaN、无穷
大
或dtype(‘float32’)太大
的
值。 可能是对象
数据
类型
的
问题。如
何在
不应用RF转换
的</
浏览 0
提问于2018-01-04
得票数 14
回答已采纳
1
回答
SageMaker分布式
训练
能用于非深度学习模式
的
训练
吗?
amazon-web-services
、
machine-learning
、
amazon-sagemaker
、
distributed-training
、
amazon-machine-learning
我正在跟踪这个页面,以了解SageMaker
的
分布式培训功能。上面写着:- SageMaker分布式培训库只能通过TensorFlow、PyTorch和HuggingFace框架
的
AWS深度学习容器在SageMaker培训平台中使用。这是否意味着我们不能使用SageMaker分布式
训练
来使用传统
的
机器学习算法(
如
线性回归、
随机
森林
或XGBoost )来
训练
机器学习模型?我有一个用例,其中
数据
集
非常
大</em
浏览 12
提问于2022-09-17
得票数 -1
1
回答
Netflow异常检测
python
包
machine-learning
、
anomaly-detection
是否有人知道任何用于Netflow异常检测
的
开源/
python
包?我在github
上
找到了一些,但是有更多经验的人。请指点。
浏览 0
提问于2017-03-22
得票数 6
1
回答
随机
森林
的
特征重要性
regression
、
random-forest
、
feature-engineering
我有一个有11个特征
的
数据
集
,我注意到操作这些特征(例如删除其中一个或一些)不会影响
训练
和测试
数据
的
错误分数,所以我不得不检查这些特性
的
重要性。以下是以下内容:正如注意到
的
那样,第一个特性具有很高
的
一致性。然而,其余
的
都是无关紧要
的
。因此,我尝试只使用第一个特性来运行模型。预期成绩分数不会显着下降,因为其余10个下降
的
特征具有很低
的
特征重要性。然而,在只使用
浏览 0
提问于2021-02-23
得票数 1
4
回答
如何避免将大文件重复加载到
python
脚本
中
?
python
、
object
、
large-file-upload
我已经编写了一个
python
脚本来获取一个大文件(一个矩阵~50k行X ~500个字节),并将其用作
数据
集
来
训练
随机
森林
模型。我
的
脚本有两个函数,一个用于加载
数据
集
,另一个用于使用上述
数据
训练
随机
森林
模型。这两种方法都工作得很好,但文件上传需要大约45秒,每次我想要
训练
一个微妙
的
不同模型(在同一
数据
集<
浏览 33
提问于2015-06-24
得票数 3
1
回答
随机
森林
分类器Matlab v/s
Python
python
、
matlab
、
machine-learning
、
statistics
、
random-forest
我在
Python
和MATLAB中使用了
随机
森林
分类器。在10棵树
的
集合
中
,我在
Python
中
获得了80%
的
准确率,在MATLAB
中
仅获得了30%
的
准确率。即使MATLAB
的
随机
森林
长有100或200棵树,这种差异依然存在。 这两种编程语言之间
的
差异可能是什么原因?
浏览 5
提问于2015-05-22
得票数 2
回答已采纳
3
回答
如
何在
python
中
改进现有的机器学习分类器?
machine-learning
、
python
、
bigdata
、
random-forest
我有一个很大
的
数据
集
(100万×50),我想预测一个特定
的
类。我已经考虑过将
数据
集
分批分离为20k。然后
训练
一个分类器(例如
随机
森林
或基本支持向量机)。然后如何通过提供额外
的
数据
集
来改进该分类器。换句话说,我如何保存在迭代1
中
创建
的
随机
森林
,并将其作为interation i+1
中
的<
浏览 0
提问于2017-03-22
得票数 1
回答已采纳
1
回答
从TreeBagger类
中
删除字段以节省内存
matlab
我正在使用Treebagger()在一个相当
大
的
数据
集
上
使用Matlab
训练
一个
随机
森林
。内存是一个问题,我看到返回
的
Treebagger类包含了许多我认为对于predict()另一个
数据
集
来说不需要
的
数据
。例如,这个类包含整个
训练
数据
(字段X和Y),它们使用了大量
的
内存。那么如何从Treebagger类<em
浏览 2
提问于2017-05-16
得票数 1
回答已采纳
2
回答
什么是
随机
种子在蔚蓝机器学习?
machine-learning
、
azure-machine-learning-studio
、
random-seed
、
iris-dataset
在一些步骤
中
,我经常遇到
随机
种子, 什么是
随机
种子整数?如何从整数值范围内仔
浏览 0
提问于2019-07-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
随机森林算法的一些应用情况
随机森林的简单实现
如何使用XGBoost和InluxDB进行时间序列预测
九道门丨如何使用随机森林进行时间序列预测?
python机器学习—随机森林算法:RandomForest
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券