我建立了一个h2o梯度增强分类器模型来预测0、1和2类的概率。训练数据中存在严重的类不平衡(93:5:2)。
虽然在混淆矩阵中没有正确地预测单个类别1和2(如预期的那样),但AUC是适合这些类单独使用的。
我计划手动预测最终的类。
我的理解是,得到的概率(P0,P1和P2)被校准,并被归纳为1。
由于h2o中的多项式模型本质上是一对多的方法,但分数是1,所以增加或比较概率是正确的吗?
因此,如果P0 = 0.40,P1 =0.35和P2=0.25,则预测的类为0(基于最大概率)。
classes)
然后,我可以比较1&2的概率,比如comparable?) (0.35) > P2 (0.25),所以预测的类应该是1?(,因为生成的类是相互排斥的,概率之和为1 ),这些都是
发布于 2021-03-26 17:10:08
对于不平衡的目标列,我将避免AUC (因为它通常会很高)。考虑使用AUC-PR或Logloss。
对于多类/多项,您将有一个-vs-所有预测。因此,每个预测都是基于其类与其他类之间的关系。所以P0是class_0对class_1 + class_2的概率,所以P(1,2) = 0.6是合理的。
为了比较概率,是的,您可以选择具有最高概率输出P1 (0.35) > P2 (0.25) -> Class = 1
的预测类。
https://stackoverflow.com/questions/66805422
复制相似问题