腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(6510)
视频
沙龙
1
回答
Python
中
训练
RF
模型
特征
的
命名
与
排序
python
、
python-3.x
、
machine-learning
、
data-science
、
random-forest
因此,我在一个相当简单
的
客户数据上
训练
了一个RandomForest
模型
。预测要么是1,要么是0,表明客户是否会流失。假设我有10个叫做'f1','f2','f3‘等等
的
特性……由于
模型
已经经过了
训练
,我又取了一段时间
的
相似数据来看看
模型
的
表现。但在这些数据
中
,
特征
可能会以不同
的
方式进行混洗。
模型
是否会查看功能<e
浏览 13
提问于2019-12-06
得票数 0
回答已采纳
1
回答
如何理解不同机器学习
模型
的
性能?
machine-learning
、
machine-learning-model
我有一个数据集,其中包含处理条件(即42个
特征
)和一类材料
的
属性(即1个目标)。为了了解不同机器学习
模型
的
性能,在
训练
中考虑了不同数量
的
特征
,对五种不同
的
机器学习
模型
进行了测试。这些
模型
分别是线性回归(LR)、贝叶斯岭(BR)、最近邻(NN)、随机森林(
RF
)和支持向量机(SVM)回归。测试数据集的确定系数(R2)用来表示经过
训练
的
机器学习
模型
<
浏览 0
提问于2020-06-16
得票数 1
回答已采纳
1
回答
哪些
模型
隐含地考虑了特性之间
的
交互?
neural-network
、
decision-trees
我想更多地了解不同
的
模型
(特别是NN和
RF
,但还有其他
模型
)如何考虑表格数据
中
的
特性之间
的
交互?例如,在
训练
时,
模型
是否能得出这样
的
结论:“虽然特性1可能与响应不直接相关,但当
特征
1较低时,功能2在预测响应方面非常有效”。因此,经过
训练
的
模型
将利用这两个
特征
之间
的
相互作用,并对它们进行相应
的
加
浏览 0
提问于2020-05-30
得票数 2
2
回答
我需要强制我
的
随机森林
模型
来学习一个关键
的
特征
之间
的
关系。我怎样才能做到这一点?
r
、
random-forest
假设给我
的
RF
模型
输入10个独立
的
特征
,当
特征
1和
特征
3是100 (或更少)时,我
的
模型
输出必须是5,尽管有其他特性
的
值。我怎样才能教我
的
射频
模型
的
关系-所以它将永远服从这一点?我尝试在
训练
集中添加重复的人工数据点,其中
特征
1和3小于或等于100,并且输出总是为零,但是
RF
模型
似乎只是基于这一
浏览 0
提问于2018-10-24
得票数 3
2
回答
特征
选择和交叉验证
statistics
、
machine-learning
、
feature-extraction
、
feature-selection
、
cross-validation
我想
训练
一个回归
模型
,为了做到这一点,我使用随机森林
模型
。然而,我也需要进行
特征
选择,因为我
的
数据集中有太多
的
特征
,我担心如果我使用了所有的
特征
,我就会过度拟合。2-执行以下步骤: 1-将数据分成4/5用于
训练
,1/5用于测试2-将此
训练
数据(完整数据
的
4/5 )分成两半: a-)在前半部分
训练
模型
并使用
训练
后<em
浏览 1
提问于2013-10-29
得票数 5
1
回答
使用CRF
模型
(CRFSuite)标记项目时处理缺失或未知
特征
python
、
missing-data
、
crf
、
missing-features
我正在使用CRFSuite (
python
-crfsuite实现)构建一个
命名
实体提取器,类似于关于
的
教程
训练
输入是一个单词序列,每个单词都有许多特性。问题是,对于我
的
特定用例,我并不总是拥有我试图识别的实体
的
功能。我希望CRF
模型
能够根据周围单词
的
特征
来识别实体。然而,当我简单地输入一个空
的
dict {}作为单词
的
特征
时,
命名
的
实体永远不会被
浏览 6
提问于2015-05-20
得票数 0
1
回答
自动
特征
选择-避免数据泄漏
的
最佳实践?
machine-learning
、
feature-selection
、
random-forest
、
cross-validation
、
feature-extraction
这个问题通常
与
所有自动
特征
选择方法有关。在我
的
特定场景
中
,我们有一个称为茶鲜和多类分类
的
python
包。 到目前为止,已经做了些什么?我使用tsfresh.extract提取
特征
,而不过滤任何特性。所有这些
特征
都被输入到
RF
模型
中
,并由
模型
自己来决定重要
的
特征
。
模型
的
性能是测量平均交叉验证
与
5
浏览 0
提问于2022-06-20
得票数 1
0
回答
训练
和测试集中
的
不同数量
的
特征
-随机森林sklearn
Python
python
、
scikit-learn
、
random-forest
我正在使用
Python
中
的
sklearn包将随机森林回归
模型
拟合到如下所示
的
数据:
rf
=
rf
.fit(X_train,y_train) 但是,然后我尝试使用
训练
集中<
浏览 1
提问于2017-06-19
得票数 1
5
回答
在机器学习
中
合并稀疏和密集数据以提高性能
machine-learning
、
classification
、
predictive-modeling
、
scikit-learn
、
supervised-learning
我有一些可预测
的
稀疏
特征
,也有一些同样具有预测性
的
稠密
特征
。我需要将这些特性结合起来,以提高分类器
的
整体性能。现在,问题是,当我试图将这些组合在一起时,密集
的
特征
往往比稀疏
的
特征
占优势,因此
与
只有密集
特征
的
模型
相比,AUC只提供了1%
的
改进。 有人遇到过类似的问题吗?真的很感激你
的
投入,有点卡住了。我已经尝试了很多不同
的
浏览 0
提问于2016-04-06
得票数 18
1
回答
sagemaker实时预测
中
的
特征
提取
amazon-web-services
、
machine-learning
、
lambda
、
amazon-sagemaker
、
fraud-prevention
我想部署一个实时预测机器学习
模型
,用于使用sagemaker进行欺诈检测。encode the categorical value)对于推断步骤,我使用了一个lambda函数,该函数调用我
的
端点来获得每个实时事务
的
预测
浏览 6
提问于2021-05-07
得票数 0
1
回答
这是什么样
的
型号/类型?
machine-learning
、
python
本质上,我想传递一个程序--一些变量,所有这些变量都是从我
的
站点上
的
一个用户那里收集来
的
,并让程序给出用户
的
真实程度
的
“分数”。我已经有了大量
的
数据,已经设置了“分数”,并且希望自己开始创建分数(目前是通过第三方完成
的
)。在阅读了关于机器学习
的
文章并询问了一些朋友之后,我选择了
python
(仍然对想法持开放态度),但我不确定我要选择哪种类型
的
算法,有监督
的
,无监督
的
,强化
浏览 0
提问于2022-06-03
得票数 1
1
回答
SparkML -创建RandomForestRegressionModel
的
df(特性,feature_importance)
scala
、
apache-spark-ml
我正在以下列方式
训练
随机森林
模型
:val stringIndexers = categoricalColumns.map { colName =>val cvRFModel = cvRF.fit(training) 我现在想要
的
是在培训后了解
模型
中
每个特性
的</e
浏览 1
提问于2018-10-01
得票数 0
回答已采纳
3
回答
特征
越多,线性
模型
越完善。
machine-learning
、
linear-algebra
我需要更多地了解特性数量
与
线性
模型
回归之间
的
关系,基于Andreas C.Müller和Sarah Guido所著
的
“机器学习
与
Python
入门”一书第47页
的
这一段:它是如何用线性代数来解释<e
浏览 0
提问于2018-08-04
得票数 0
回答已采纳
2
回答
在XGBoost
中
如何适合成对
排序
模型
?
search
、
ranking
、
xgboost
、
gbm
据我所知,为了
训练
学习对
模型
进行
排序
,您需要在数据集中有三件事:组或查询id例如,微软学习
排序
数据集使用这种格式(标签、组id和特性)。我正在试用XGBoost,它利用GBM来进行两两
排序
。他们有一个
排序
任务
的
示例,它像上面一样使用C++程序在Microsoft上学习。但是,我正在使用他们
的
Python
包装器,似乎找不到可以输入组id
的
位置(qid )。我可以仅仅使用<e
浏览 0
提问于2016-02-10
得票数 26
回答已采纳
1
回答
Python
模型
中
的
目标编码
encoding
、
target
我用
python
做了一个
模型
,这个
模型
使用了目标编码。我使用了一个有25000行
的
数据集,分为
训练
数据集和测试数据集。这个
模型
确实运行得很好。但是,我现在想要在全新
的
数据上运行
模型
--比如excel文件
中
只有一行数据。我需要知道它
的
代码,如果有人能帮助我,我会很感激
的
。我对
python
有些陌生。这是我编写
的
代码
的
一部分,用于从25000行创建<e
浏览 3
提问于2018-10-24
得票数 2
1
回答
为什么决策树能很好地处理不平衡
的
数据?
machine-learning
、
linear-regression
、
decision-tree
我试验了来自卡格尔
的
欺诈样本。我采取了线性回归和决策树。线性回归按预期工作:我们有很高
的
查准率和召回率,而抽样不足会使情况更糟。为什么两种模式有这么大
的
区别?
浏览 0
提问于2017-09-07
得票数 1
回答已采纳
1
回答
选择/规范HoG参数以进行目标检测?
python
、
computer-vision
、
feature-extraction
、
scikit-image
我对如何处理不同长度
的
HoG
特征
向量感到困惑。现在,我从图像中提取要运行分类器
的
区域--比如说,使用滑动窗口方法。我提取
的
一些窗口比分类器
训练
的
图像
的
大小要大得多。(它是关于在测试图像
中
可能期望
的
物体最小尺寸
的
训练
)。 问题是,当需要分类
的
窗口大于
训练
图像大
浏览 5
提问于2014-05-23
得票数 4
回答已采纳
1
回答
如何在
Python
中
为内核创建各向异性指数和高斯相关函数?
python
、
scikit-learn
、
gaussian
、
kriging
我有一个由1000个观察到
的
样本组成
的
数据集,6个
特征
组成了X,还有一个目标变量形成了Y。如何在
python
中
定义
命名
函数?
浏览 3
提问于2020-05-19
得票数 0
回答已采纳
1
回答
sklearn :合并随机林隙并做出财务决策
python
、
scikit-learn
、
random-forest
我建立了RandomForest (
RF
)
与
滑雪板包。例如,有10,000个样本,我从不同
的
实验室接收数据。FR1用Lab1
的
数据
训练
,FR2用Lab2
的
数据
训练
。FR5使用来自Lab5
的
数据进行培训 每个实验室
的
特征
数为4,000,因此每个实验室<em
浏览 1
提问于2018-11-07
得票数 0
回答已采纳
2
回答
SHAP值可以解释,对吗?
python
、
machine-learning
、
data-science
、
xgboost
、
shap
我在使用SHAP value来解释基于树
的
模型
时遇到了一个问题。首先,我输入了大约30个
特征
,我有2个
特征
,它们之间有很高
的
正相关性。在此之后,我
训练
了XGBoost
模型
(
Python
),并查看了2个
特征
的
Shap值,Shap值具有负相关性。 你们能给我解释一下,为什么两个
特征
之间
的
输出SHAP值不具有
与
输入相关相同
的
相关性吗?我能不能相
浏览 11
提问于2019-11-25
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
即时通信 IM
活动推荐
运营活动
广告
关闭
领券