腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
在
机器
学习
中
数据
集
不平衡
的
情况下
,
AUC
是
比
准确性
更好
的
指标
吗
?
如果
不是
,
那么
哪个
是
最好
的
指标
?
、
、
、
、
auc
在
处理
不平衡
数据
方面是否
更好
。
在
大多数
情况下
,
如果
我处理
的
是
不平衡
的
数据
,
那么
准确性
并不能给出正确
的
想法。尽管准确率很高,但模型
的
性能很差。
如果
不是
auc
,这是处理
不平衡
数据
的
<e
浏览 146
提问于2019-02-26
得票数 0
回答已采纳
1
回答
简易神经网络
在
keras
中
的
实现
、
、
、
、
我有一个二进制分类问题(良性/恶意),我已经应用简单
的
神经网络一个隐藏层来解决这个问题。我
在
我
的
数据
集中有46个特征,对于隐藏层,我使用
的
是
46/2。而且我
的
数据
没有缩放,所以我使用
的
是
标准缩放器。我得到了大约99.79%
的
准确性
与代码。然而,
准确性
是
出乎意料
的
,我预计
在
93-94%左右,我
浏览 0
提问于2018-02-17
得票数 2
2
回答
在
keras中使用class_weight处理
不平衡
数据
集
时,准确率会显著降低
、
、
、
我有一个很不直观
的
问题。我正在对亚马逊书评进行情感分析,
数据
集
严重
不平衡
。正面评论几乎
是
负面评论
的
10倍,训练和测试
的
准确率都在90%左右(
数据
集
不平衡
)。然而,当我尝试
在
class_weight = {0:10 , 1:1}
的
帮助下平衡
数据
集
时,训练和测试
的
准确率都下降到了65%左右。同样,
如果
我
的<
浏览 2
提问于2018-11-25
得票数 1
2
回答
哪一种度量更适合于增强方法
、
、
、
、
我
在
一个包含30万个样本
的
数据
集
上工作,并试图将logistic回归(具有梯度下降)和用于二进制分类
的
LightBoost进行比较,以便选择
更好
的
。我想知道在这种
情况下
,我应该使用
哪个
指标
,为什么?
AUC
测试值?LogLoss ??
浏览 0
提问于2019-04-16
得票数 1
回答已采纳
1
回答
CNN对验证
集
的
过度拟合提高测试
集
的
性能
、
、
、
、
我实际上
是
用CNN对图像进行分类。我有16个类和大约3000张图片(非常小
的
数据
集
)。这是一个
不平衡
的
数据
集
。我做了一个60/20/20
的
分割,在所有的集合
中
,每个类
的
百分
比
是
相同
的
。我用权值正规化。当我过度适应(epoch=350,loss=2)时,我
的
模型
的
准确性
(70
浏览 0
提问于2019-05-16
得票数 2
1
回答
如何编辑weka配置以查找"1“
我有一个包含bool结果
的
arff表。但不幸
的
是
,大多数算法总是选择"0“。(
如果
可能)?
浏览 0
提问于2014-04-11
得票数 0
2
回答
机器
学习
中
的
评价
指标
、
、
、
下面以一个二分类问题为例,
如果
我
在
训练中使用“
准确性
”作为度量标准,并使用ROCR包找到
AUC
分数,这将是如何逻辑
的
?或者我应该始终使用"ROC“作为计算
AUC
分数
的
度量标准?
数据
集
不平衡
。
浏览 0
提问于2016-10-20
得票数 1
1
回答
为什么
在
机器
学习
模型
中
,所有真正
的
积极因素都被归类为真正
的
消极因素?
、
、
我为
数据
拟合了一个随机森林模型。我将我
的
数据
集
按70:30
的
比例分为训练和测试,并对模型进行了训练。我对测试
数据
的
准确率为80%。然后,我取了一个基准
数据
集
,并用该
数据
集
测试了模型。该
数据
集
仅包含具有真实标签(1)
的
数据
。但是,当我使用该模型获得基准
数据
集
的
预测时,所有真正<
浏览 13
提问于2020-02-22
得票数 0
3
回答
GridSearch简历:
不平衡
数据
集
的
合适评分标准
、
我
是
机器
学习
的
新手。这是我
的
1^{st}
机器
学习
项目,我正在对
不平衡
的
数据
集
进行分类。目标变量
中
也有多个类。roc_au有时用于
不平衡
的
数据
集
。但是有几个 ‘roc_<e
浏览 0
提问于2021-10-26
得票数 1
2
回答
不平衡
数据
的
评价
指标
、
、
、
、
嗨,我
是
个CS研究生我
的
数据
集
是
时间序列传感器
数据
,异常(正类)比率
在
5%到6%之间。📷我认为用宏avg (0.40)报告f1评分
是
合理
的
。 可以
吗
?谢谢你
浏览 0
提问于2021-07-02
得票数 0
1
回答
哪种分类度量适合于每个类别分布场景?
、
、
、
目前,我有一个平衡
的
数据
集
(我人为地过采样以使其平衡)。我
的
类
是
二进制(0或1)。我想知道,在
数据
集
具有大致相等
的
类平衡
的
情况下
,“
准确性
”是否
是
使用
的
“最佳”度量?然而,更广泛地说,是否有一个好
的
“经验法则”或“最佳实践”来衡量
哪个
评分标准(
准确性
、精确性、回忆性、
AUC
、.)基于
数
浏览 0
提问于2018-01-19
得票数 1
1
回答
创建分类
数据
集
,一个好
的
数据
集
应该达到多大
的
平衡?
、
、
、
我正在创建一个有4个类
的
数据
集
,其中有50K行,我已经获得了86%
的
准确率,0.85
的
预测,0.86
的
召回和0.71
的
F1-分数支持向量机上
的
80,20分裂。我必须在一篇研究论文中公布这个
数据
集
,但我关心
的
是
班级百分
比
的
年龄分布。例如,类1
比
类4有更多
的
数据
。(
数据
集注释已经
浏览 0
提问于2022-01-06
得票数 0
3
回答
对验证丢失或
准确性
的
早期停止?
、
、
、
我目前正在训练一个神经网络,我无法决定使用哪一个来实现我
的
早期停止标准:验证丢失,或者像
准确性
/f1core/
auc
/任何在验证
集
上计算
的
指标
。有人对何时使用验证损失和何时使用特定
的
度量有指示
吗</
浏览 0
提问于2018-08-20
得票数 44
回答已采纳
1
回答
如何提高模型
在
分类方面的性能?
、
、
嗨,我面临
的
问题
是
,我有
数据
集
来判断人是否感到寒冷,给我
的
数据
集
被称为坏
数据
集
,我希望最大限度地提高模型
的
准确性
和精度。
浏览 1
提问于2022-12-03
得票数 0
1
回答
如何解释近乎完美的准确率和
AUC
-ROC,但F1为零-分数,精度和召回率
、
、
、
他们处于极
不平衡
的
数据
中
(大约14300:1)。我得到了几乎100%
的
准确率和ROC-
AUC
,但准确率,召回率和f1分数为0。我理解
在
非常
不平衡
的
数据
中
,
准确性
通常是没有用
的
,但为什么ROC-
AUC
度量也接近完美?) false_positive_rate, true_positive_rate, thresholds = roc_curve(y
浏览 0
提问于2016-01-10
得票数 22
回答已采纳
1
回答
模型精度:如何确定?
、
、
、
、
对于构造分类器
的
方法,如多项式朴素贝叶斯或支持向量机,我有一些疑问。我将通过这些步骤来看看这个方法是否可行。我没有太多
的
经验,
在
模型建设,所以任何建议都会很好!我
的
数据
集
大约。📷from sklearn.model_selection import train_test_split模型来创建一个SVM分类器: from
浏览 0
提问于2020-10-13
得票数 0
回答已采纳
2
回答
我是否过度拟合我
的
随机森林模型(更多
的
信息,
在
描述)?
、
、
、
首先,
如果
这是个新手
的
问题,很抱歉!对所有这些东西来说都是比较新
的
。把这贴在堆栈溢出上有人把我送到这里!希望这是个合适
的
地方。无论如何,我正在处理22个
数据
集
,每个
数据
集
有180个"Oddball“
数据
和720个”标准“
数据
。我试图使用随机森林进行分类(例如,oddball=1,standard=0)。我知道这两个因素应该有大致相等
的
试验/观察,但
如果
我使用75
浏览 0
提问于2019-11-20
得票数 3
回答已采纳
1
回答
我还能做什么来帮助我
的
模型我
的
分类任务?
、
我有一个分类任务,目前我得到了非常低
的
精度
指标
(我
的
最高精度得分约为20%)。我
的
数据
集
有1500个
数据
点,不超过9个特征。关于因变量
的<
浏览 0
提问于2023-02-27
得票数 0
回答已采纳
2
回答
为什么我们要在分类问题上最大化
AUC
?
、
、
我想知道,为什么我们
的
目标
是
最大化
的
AUC
时,最大
的
准确性
,产量相同? 我认为,随着首要目标的最大
准确性
,
AUC
将自动大。
浏览 2
提问于2017-10-14
得票数 4
回答已采纳
2
回答
机器
学习
的
不平衡
训练
数据
(CNNs / RNNs)
、
、
、
我发现,当我
在
不平衡
的
训练
数据
上训练一些CNN和RNN时,我
的
训练收敛得相对较快,准确率大约是较大类别的百分
比
(因此,
如果
有80%是的例子,它可能总是会输出
是
)。我觉得这是可以解释
的
..这个解决方案
是
局部最优
的
,网络
在
训练时不能逃脱它。这种解释正确
吗
?这种行为在这些
情况下
最常见
吗
?我能对它做些什么呢?合成更多
的
浏览 4
提问于2017-04-22
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
处理不平衡数据的技巧总结!
处理不平衡数据的技巧总结
如何评估机器学习模型的性能
方法总结:教你处理机器学习中不平衡类问题
机器学习模型在生产中表现不佳?问题可能出在这9个地方
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券