首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >XGBoost预测的概率

XGBoost预测的概率
EN

Data Science用户
提问于 2020-11-10 07:54:37
回答 2查看 542关注 0票数 1

我看了足球数据,并试图预测是否会出现一个目标二进制的xgboost :逻辑。

我的数据是1:10不平衡,没有比目标更占优势的目标。我在mlr包中使用了smote或task.over来过度采样(因子为4)。

我训练模型,调和交叉验证,但预测似乎是合理的(低拍卖30%,但在其他统计数据高)。

然而,当我看这个模型预测的概率时,它比实际的平均值要大得多。有什么能导致这件事的吗?

概率是多少?也就是说,第一类概率是指他们在第一类中的概率,所以可能并不能真正代表得分的概率。

提前感谢

EN

回答 2

Data Science用户

发布于 2021-02-25 16:20:05

通过过度抽样,你告诉你的模型目标比它们更普遍,所以它的预测概率当然太高了。

您可以撤消重采样导致的概率变化,例如这个职位这个CV.SE一号,或者使用更一般的“概率校准”方法,例如我们的标记概率校准

票数 1
EN

Data Science用户

发布于 2021-02-25 16:06:04

如果预测的结果目标(即本例中的概率)始终高于实际,这就意味着您有统计偏差模型。统计偏差是当有一个系统不同的结果与人口参数被估计。

有许多方法可以减少统计偏见:

  • 重采样在更极端的比率
  • 将损失函数改为更严厉的错误预测。
  • 变更算法
票数 0
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/85191

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档