腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(102)
视频
沙龙
1
回答
随机
森林
的
ROC
曲线
在
R
中
使用
pROC
拟合
对象
,
以
正
“
投票
”
或
负
“
投票
”
作为
预测器
、
、
、
权重是一个连续
的
预测因子。
使用
RF对肥胖进行分类: library(randomFores) inbag 0 -none- NULL terms 3 terms call 我相信
投票
矩阵显示了从0到1,rF为将每个病例分类到任何一个类别所投<
浏览 53
提问于2019-03-21
得票数 2
回答已采纳
2
回答
当
使用
多个分类器-如何衡量整体
的
性能?[SciKit学习]
、
、
、
、
现在,分类器
在
10倍CV
的
训练集上具有大致相似的性能指标(83-94%
的
准确率/精度/等等),所以我
的
“朴素”方法是简单地
使用
多个分类器(
随机
森林
、ExtraTrees、支持向量机(线性核)、支持向量机我
的
问题是:如何获得不同分类器和/
或
它们
的
投票
预测
的
性能指标?也就是说,我想看看
使用
多个分类器是否能提高我
的
性能,或
浏览 2
提问于2014-02-01
得票数 8
回答已采纳
2
回答
有什么方法来绘制集合硬
投票
分类器
的
ROC
曲线
吗?
、
、
我选择硬
投票
作为
合奏技巧。我试图为我
的
集成方法绘制
ROC
曲线
,但由于显示了
ROC
曲线
不能用于硬
投票
集成方法这一错误,它是行不通
的
。因此,我
的
问题是,是否有任何可能
的
方法,我可以为我
的
硬
投票
集成分类器绘制
ROC
曲线
在
python。
浏览 0
提问于2020-07-07
得票数 3
1
回答
套袋与增压
的
区别
、
、
、
有人能解释一下袋装和助推之间
的
基本区别吗?在哪种情况下可以
使用
哪种技术?
浏览 0
提问于2018-10-12
得票数 1
回答已采纳
1
回答
如何在
r
中
检查randomForest
中
的
拆分值?(对
森林
的
解释
、
、
、
我正在
使用
randomForest
在
r
中
构建一个
随机
森林
。我所有的特征都是绝对
的
。例如,我
的
特色“2020年大选
投票
方法”
的
响应为{"“、"AB”、"AP“、"MB”、"P"}。我想知道我
的
树是否通常在空字符串和其他响应之间分裂(表示
投票
方法比是否记录表决更重要)。 我一直
在
检查
森林
中<
浏览 3
提问于2022-04-13
得票数 2
2
回答
利用scikit并行生成
随机
森林
-学习
、
、
、
、
主要问题:我如何将python和scikit
中
的
不同randomForests结合起来--学习? 我目前正在
使用
R
中
的
randomForest包来
使用
弹性映射约简来生成
随机
森林
对象
。由于输入数据太大,无法
在
一台机器上容纳内存,所以我将数据采样到较小
的
数据集中,并生成包含较小树集
的
随机
森林
对象
。然后,我
使
浏览 12
提问于2014-09-18
得票数 9
回答已采纳
3
回答
随机
森林
分类器- KFold CV调很深
的
树->过配?
、
、
、
我正在对python
中
的
随机
森林
进行调优,并想知道我
的
模型是否/为什么过于合适。AUC
或
F1 (由于数据不平衡) 我得到
的
结果倾向于建议
使用
非常深
的
树,即深度18,不限制每次分割
的
样本数=2(默认)。
在
树
的
最大深度上,我
的
分数几乎是单调增加
的
。考虑到结果和树有多深-我怀疑这个模型太合适了?如果是这样的话,为什么我不观察到
在</e
浏览 0
提问于2018-06-19
得票数 3
2
回答
ROCR包裹..。我没有得到什么?
、
我正在用
R
中
的
ROCR包测试一个简单
的
案例--基本上,这是我
的
代码。我有一组真值,对于每个值,我都有一组预测,如果预测值
在
真值
的
1以内,则标签是1,否则为0,如下所示: preds<-c(6,3,2,1,4) predtest<-prediction(df$preds, df$labels) auc <- performance(predte
浏览 6
提问于2016-05-17
得票数 2
回答已采纳
2
回答
如何通过添加额外
的
树来提高单个决策树
的
性能?
、
、
我有一个二进制分类任务,数据存在不平衡问题(99%为
负
,1%为
正
)。我能够建立一个决策树,仔细调整,加权,和后修剪。
以
tree1为例,它具有较高
的
召回率和中等
的
高精度,
在
检测
正
实例方面表现良好。我想知道如何通过集成方法(打包、提升、堆叠等)来提高它
的
性能。 需要注意
的
一点是,由于实时性要求,
在
我们
的
生产环境
中
不允许
使用
大量
的
树(例如,带有100+
浏览 0
提问于2023-03-20
得票数 1
2
回答
从一组
随机
图像
中
过滤出照片
的
算法
、
、
、
我有一堆
随机
的
图像文件(纸质文档扫描,徽标,当然还有相机拍摄
的
照片),我只需要过滤掉照片来创建预览。在上提出
的
解决方案只能在有限
的
方式下工作(即,一些标志是完全黑色
的
字体,一些标志只有颜色-没有白色区域),有时我扫描了一张白纸,其中包含多张周围有空白
的
照片-我也需要识别这些照片-因为这样我就必须键入白色部分,并将扫描
中
的
照片保存在单独
的
文件
中
。
浏览 0
提问于2013-04-30
得票数 0
回答已采纳
1
回答
求最佳单调
曲线
拟合
编辑:
在
我问了这个问题一段时间后,一个名为MonoPoly (available )
的
R
包出现了,它做了我想做
的
事情。我强烈推荐它。 最初,我一直在对我
的
结果进行多重
拟合
,直到我找到了一个特定
的
数据集,这个结果才开始很好地工作。此数据集中
的
数据具有非单调性。
浏览 4
提问于2016-04-05
得票数 5
回答已采纳
1
回答
用层次
随机
林模型估计类概率
、
、
、
我
使用
随机
森林
分类器(
R
)来预测多个本地植物群落
的
空间分布,
使用
各种环境变量
作为
预测因子。这个分类系统是分层
的
,每个连续
的
级别在其类描述
中
变得更加详细。例如,我有一个有两个层次
的
层次分类系统,最高
的
层次由两类组成:
森林
(F)和草地(G)。
在
第二级,每个
森林
和草地类由2个子类(F1、F2和G1、G2)组成。例如,
使用</
浏览 3
提问于2014-04-14
得票数 1
回答已采纳
3
回答
在
R
中
创建多条
ROC
曲线
?
、
我
的
目标是创造150个AUC分数。auc(
roc
(df$label, df$col1)), ...我可以在这里
使用
Map/sapply/lapply,但是还有其他方法
或
函数吗?
浏览 0
提问于2018-04-16
得票数 3
回答已采纳
11
回答
在
R
中计算AUC?
、
、
、
给定一个分数向量和一个实际类别标签向量,如何在
R
语言
或
简单
的
英语中计算二元分类器
的
单数AUC度量?
的
第9页似乎要求知道类标签,这里是我不理解
的
因为
R
(不要与
R
语言混淆)被定义为向量而被用作函数?
浏览 6
提问于2011-02-05
得票数 52
回答已采纳
1
回答
我应该用哪种统计技术来进行一次人内重复测量
的
研究?
、
、
、
我想看看人格特征(5个特征变量值从0到5)是否可以预测某人是否会在工作
中
给予反馈(离散
的
结果,是/否),以及他们会提供什么样
的
反馈(利克特所以,我有我
的
自变量(人格),我试图预测我
的
重复测量结果变量(反馈)。我还有参与者
在
多大程度上实际上是一个主持人变量,与反馈数据一起收集
的</em
浏览 0
提问于2023-05-24
得票数 1
3
回答
用什么预测模型来推断性别?
、
、
我
的
数据如下:birth_date缺少634,990个值 由于我有900 k项,这两项都是相当大
的
数量,所以我不能丢弃空行。对于birth_date,有人建议
使用
链式方程(小鼠)
的
多变量计算。我不知道我应该为gender
使用
什么预测模型。
在
未缺少
的
数据
中
,男性比女性多5倍。我
使用
这
浏览 0
提问于2019-05-07
得票数 5
回答已采纳
2
回答
Tensorflow决策
森林
自定义指标与树
的
数量
、
、
、
、
我已经
使用
tensorflow决策
森林
创建了一个分类模型。我正在努力评估非默认指标(
在
本例
中
为PR-AUC)
的
性能与树
的
数量之间
的
变化。 下面是我尝试
的
一些代码。,
使用
tfdf_clf.make_inspector().training_logs() #[TrainLog(num_trees=1, evaluation=Evaluation(num_examples0.9005518555641174, loss=0.5672071
浏览 46
提问于2021-10-22
得票数 2
1
回答
Flink SVM 90%
的
错误分类
、
、
、
我尝试
使用
flink-ml实现进行一些二进制分类。当我评估分类时,我
在
训练数据集上得到了大约85%
的
错误率。我绘制了3D数据,看起来你可以用超平面很好地分离数据。当我试图从支持向量机
中
获得权重向量时,我只看到了
在
不拦截超平面的情况下获得权重向量
的
选项。所以只有一个超平面通过(0,0,0)。绘制
的
数据如下所示:
浏览 4
提问于2017-12-02
得票数 7
4
回答
有多少种方法来检查模型是否过模?
、
、
我试着避免
在
我所能想到
的
所有方法
中
过度
拟合
,嵌套交叉验证
的
平均输出是
r
2 0.88,我不确定我是否可以相信它,或者是否有其他方法可以看到这是否过度合适。比较两种特征选择方法(一种
使用
xgboost从SHAP值
中
认为重要
的
特征,另一种
使用
Boruta,这两种方法
在
10个嵌套
的
CV k-折叠中平均给出0.87-0.88
r
2,而在57个特征
中
仅删除3
浏览 0
提问于2020-07-07
得票数 3
回答已采纳
2
回答
多项式数据与
R
的
glm()
、
如何让
R
的
glm()匹配多项式数据?我已经尝试了几次'family=AAA(link="BBB")‘
的
迭代,但我似乎无法得到与之匹配
的
微不足道
的
预测。例如,请
使用
R
的
glm帮助匹配多项式数据y=x*xplot(parabola)test=data.frame(x=seq(-5,5,2)
浏览 1
提问于2014-02-13
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习之非均衡数据处理
R语言梯度提升机 GBM、支持向量机SVM、正则判别分析RDA模型训练、参数调优化和性能比较可视化分析声纳数据
Matlab建立SVM,KNN和朴素贝叶斯模型分类绘制ROC曲线
机器学习三人行-手写数字识别实战
ROC曲线和AUC面积理解
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券