我看了足球数据,并试图预测是否会出现一个目标二进制的xgboost :逻辑。
我的数据是1:10不平衡,没有比目标更占优势的目标。我在mlr包中使用了smote或task.over来过度采样(因子为4)。
我训练模型,调和交叉验证,但预测似乎是合理的(低拍卖30%,但在其他统计数据高)。
然而,当我看这个模型预测的概率时,它比实际的平均值要大得多。有什么能导致这件事的吗?
概率是多少?也就是说,第一类概率是指他们在第一类中的概率,所以可能并不能真正代表得分的概率。
提前感谢
https://datascience.stackexchange.com/questions/85191
复制相似问题