腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1473)
视频
沙龙
1
回答
如何
计算
分层
K
折
交叉
验证
中
不平衡
数据
集
的
假
阳性率
?
python
、
scikit-learn
、
cross-validation
、
k-fold
、
false-positive
下面几行是示例代码,我可以在其中
计算
准确率、精确度、召回率和f1分数。
如何
计算
分层
K
折
交叉
验证
的
假
阳性率
(FPR)?
浏览 32
提问于2021-11-14
得票数 1
1
回答
如果我已经在使用打击炮,是否有必要使用
分层
抽样?
cross-validation
、
smote
我已经用300
K
以上
的
观测
数据
对我
的
不平衡
数据
集
应用了SMOTE。使用
分层
的
K
-折叠
交叉
验证
,而不仅仅是普通
的
K
-折叠
交叉
验证
(似乎不太可能,每个
K
-折叠训练
集
都会
不平衡
),这是否仍然有意义?
浏览 0
提问于2021-10-19
得票数 0
回答已采纳
1
回答
如何
计算
K
折
交叉
验证
的
不平衡
数据
集
的
精确度、召回率和f1得分?
python
、
scikit-learn
、
random-forest
、
cross-validation
、
supervised-learning
我有一个包含二进制分类问题
的
不平衡
数据
集
。我已经构建了随机森林分类器,并使用
k
折
交叉
验证
10
折
。model_selection.KFold(n_splits=10, random_state=42)我拿到了10
折
的
结果0.60333333 0.52333333 0.73 0.753333
浏览 1
提问于2017-10-06
得票数 12
回答已采纳
1
回答
不平衡
的
学习问题-样本外与
验证
python
、
keras
我正在训练三个班级,其中一个占主导地位
的
班级约占80%,其他两个班级甚至。我能够使用欠采样/过采样技术来训练模型,以获得67%
的
验证
准确率,这对于我
的
目的来说已经相当不错了。问题是这种性能只存在于平衡
的
验证
数据
上,一旦我用
不平衡
的
数据
对样本外进行测试,它似乎就偏向于甚至类预测。我也尝试过使用加权损失函数,但在样本之外也没有什么乐趣。有没有好
的
方法来确保
验证
性能
的<
浏览 6
提问于2019-07-10
得票数 0
1
回答
如何
在sklearn
中
对
不平衡
数据
集
进行
交叉
验证
python
、
machine-learning
、
scikit-learn
、
classification
我有一个高度
不平衡
的
数据
集
,我想执行二进制分类。 在阅读一些帖子时,我发现sklearn为
不平衡
数据
集
提供了class_weight="balanced"。所以,我
的
分类器代码如下。clf=RandomForestClassifier(random_state = 42, class_weight="balanced") 然后,我使用上面的分类器进行了10
折
交叉
验证</
浏览 30
提问于2019-03-31
得票数 5
回答已采纳
1
回答
Caret软件包:列车功能
的
分层
交叉
验证
r-caret
、
cross-validation
是否有一种方法来执行
分层
交叉
验证
时,使用火车功能,以适应一个大
的
不平衡
的
数据
集
模型?我知道直接
k
折叠
交叉
验证
是可能
的
,但我
的
类别是高度
不平衡
的
。我见过关于这个话题
的
讨论,但没有真正明确
的
答案。
浏览 0
提问于2016-03-10
得票数 11
回答已采纳
2
回答
在scikit-learn中使用
交叉
验证
时绘制精度-召回曲线
python
、
scikit-learn
我正在使用
交叉
验证
来评估具有scikit-learn
的
分类器
的
性能,并且我想要绘制精度-召回率曲线。我在scikit-learn`s
的
网站上找到了来绘制PR曲线,但它没有使用
交叉
验证
进行评估。在使用
交叉
验证
时,
如何
在scikit学习
中
绘制精确召回曲线?我执行了以下操作,但我不确定这是否是正确
的
方法(psudo代码): pr
浏览 2
提问于2014-10-27
得票数 7
1
回答
使用训练
数据
评估Python图像分类精度
python
、
pandas
、
classification
、
confusion-matrix
我已经对一幅图像进行了分类,并将其相应
的
像素
数据
作为
数据
集
输出。我也有一个相同类型
的
数据
集
,其样本数量不一致,称为训练
数据
。我希望使用用户自己创建
的
训练
数据
集
对分类后
的
像素
数据
再次运行准确性评估。我曾尝试使用python spleen confusion_matrix和accuracy_score,但我
的
问题是这两个
数据
浏览 21
提问于2018-09-01
得票数 0
1
回答
不同尺寸多个测试
集
RMSE
的
比较
machine-learning
、
error-handling
、
rmse
、
model-evaluations
我拥有的
数据
是一个时间序列
数据
(股票回报),我正在训练一个随机森林回归者。观察总数= 2499我
的
意思是,随着窗口大小
的
增加,测试
集
的
大小会减少。窗口大小为500,测试
集
大小为1999。使用窗口大小700,
浏览 0
提问于2021-08-13
得票数 0
1
回答
如何
防止在CNN分类
的
10
折
交叉
验证
中
,一个折叠比其他9个折叠执行得更差
python
、
keras
、
conv-neural-network
、
cross-validation
、
k-fold
我目前在Keras
的
2D CNN上工作,用于MRI分类。分类比大约是60/40,我有155名患者,每个患者都有一个由大约180个切片组成
的
MRI,CNN
的
输入是一张MRI图像
的
切片(256*256px)(所以总共输入了大约27900张图像,每个256*256我测试了不同
的
模型,并总是使用混洗
分层
10
折
交叉
验证
和EarlyStopping监视器对它们进行评估,它们都表现得非常好,大约95%到98%
的
验
浏览 100
提问于2019-09-10
得票数 0
1
回答
关于
如何
处理
不平衡
数据
的
主要选项
xgboost
、
cross-validation
、
class-imbalance
、
smote
、
auc
据我所知,大致上有三种处理二进制
不平衡
数据
集
的
方法:随机创建
k
折叠
交叉
验证
样本(或者更好地使用
分层
k
折叠:https://scikit-learn.org/0.16/modules/generated选项2 随机创建
k
折叠
交叉
验证
样本(或者更好地使用
分层
k
折叠创建
k
折叠
浏览 0
提问于2020-06-07
得票数 2
1
回答
kNN在垃圾邮件分类
中
的
改进
matlab
、
machine-learning
、
classification
、
spam
、
knn
数据
集
以词袋表示法表示,它包含约x。10000个观测值,约900个功能。Matlab是我用来处理
数据
的
工具。 在过去
的
几天里,我尝试了几种机器学习方法:支持向量机、贝叶斯和kNN。在我看来,当涉及到最小化
假
阳性率
时,kNN
的
性能优于SVM和贝叶斯。通过10倍
交叉
验证
,我使用
k
=9和曼哈顿距离得到了0.0025
的
假
阳性率
。海明距离在相同
的<
浏览 2
提问于2014-03-22
得票数 0
2
回答
随机森林
的
手动
k
-折叠
交叉
验证
python
、
random-forest
、
cross-validation
、
k-fold
我正在使用随机森林分类器,并且我想执行
k
折
交叉
验证
。我
的
数据
集
已经被分成10个不同
的
子集,所以我想用它们来做
k
折
交叉
验证
,而不是使用随机拆分
数据
集
的
自动函数。这在Python
中
是可能
的
吗?
浏览 8
提问于2021-03-08
得票数 0
1
回答
用朴素贝叶斯分类器可疑
的
低
假
阳性率
?
machine-learning
、
classification
、
svm
、
supervised-learning
、
naive-bayes-classifier
我正在执行钓鱼URL分类,我正在比较平衡
的
2类
数据
集
(合法URL,phishy )上
的
几个ML分类器。随机森林分类器、Ada Boost分类器、多树分类器和
K
分类器
的
分类准确率达到90%左右,
假
阳性率
达到11~12%。(图)事情是这样
的
。我也尝试过高斯铌
浏览 0
提问于2020-05-12
得票数 0
回答已采纳
3
回答
训练/测试尺寸和偏差
machine-learning
、
logistic-regression
、
supervised-learning
我
的
数据
集
上
的
信息如下:(第80/20号规则)test size = 56 # of events in test = 8 我想我
的
分类器和结果可能会因为这个比例不相等而受到影响。你个人对这些
数据
有何看法?
浏览 0
提问于2020-08-30
得票数 2
回答已采纳
3
回答
如何
使用tensorflow执行
k
折
交叉
验证
?
python
、
tensorflow
、
cross-validation
、
train-test-split
我现在
的
情况是,我将所有
数据
都放在一个CSV文件
中
,而不是分开,并且我想对这些
数据
应用
k
折
交叉
验证
。tf.contrib.learn.datasets.base.load_csv(filename="mydata.csv",
如何
使用与IRIS示例相同
的
多
浏览 0
提问于2016-09-28
得票数 26
1
回答
R H20 -
分层
抽样和非I.D.
交叉
验证
。行
r
、
cross-validation
、
h2o
我正在使用H2O来分析
数据
集
,但我不知道
如何
正确地对
数据
集
执行
交叉
验证
。我有一个
不平衡
的
数据
集
,所以我希望执行
分层
交叉
验证
(如果输出变量用于平衡每个分区上
的
组)。然而,最重要
的
是,我还有一个问题,就是我
的
许多行都是重复
的
(一种实现权重而不实际拥有权重
的
方法)
浏览 2
提问于2019-01-02
得票数 0
回答已采纳
1
回答
使用keras进行
K
折
交叉
验证
keras
、
cross-validation
由于神经网络
的
运行时间很长,似乎
k
-
折
交叉
验证
在convn网络
中
并没有得到重视。我有一个很小
的
数据
集
,我对使用给定
的
示例进行
k
-
折
交叉
验证
很感兴趣。有可能吗?谢谢。
浏览 3
提问于2016-12-19
得票数 12
6
回答
帮助理解
交叉
验证
和决策树
algorithm
、
machine-learning
、
decision-tree
我一直在阅读决策树和
交叉
验证
,我理解这两个概念。但是,我很难理解
交叉
验证
,因为它涉及决策树。基本上,
交叉
验证
允许您在
数据
集
相对较小时在培训和测试之间进行交替,以最大限度地提高您
的
错误估计。一个非常简单
的
算法是这样
的
: 决定了您想要
的
折叠数(
k
) 将
数据
集
细分为
k
折叠、,使用
k
-1
折</
浏览 0
提问于2010-02-22
得票数 37
回答已采纳
1
回答
机器学习
中
如何
利用
K
次
验证
进行欠采样
python
、
machine-learning
我正在为我
的
项目rn处理一个高度
不平衡
的
数据
集
,为了简单起见,我将在这里给出一个简单
的
例子:
数据
集
有20‘0和80’1
的
数,所以总数是100。假设我已经使用under-sampling进行
分层
拆分(X_train.shape为80,X_test.shape为20),那么我
的
问题是
如何
在列车
数据
集中同时使用
K
-折叠
验证
来实现。我最
浏览 2
提问于2021-02-07
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
模型选择与评价(一)
机器学习模型评估方法
机器学习学习笔记二
机器学习的心腹大患:数据泄漏
算法研习:机器学习中的K-Fold交叉验证
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券