首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >帮助培训XGB

帮助培训XGB
EN

Data Science用户
提问于 2018-02-09 15:40:38
回答 1查看 49关注 0票数 1

我为一个高度监管的实体工作,所以我必须混淆我正在做的事情;我将提供下面的例子来说明我正在做的事情。

我正在训练一个XGB模型的NLP评论的狗品种(Tensorflow,滑雪)。我有一个关于狗的数据集,我用它来训练algo和交叉验证测试是很有希望的。

然而,我的测试数据不仅仅是关于狗的,而是关于动物的。所以数据可以是关于狗,猫,大象,什么的。现在,XGB模型给出了它不识别默认值(一个类别)的所有动物。我怎么能让我的XGB只说“我不知道”呢?是否有一种方法将默认值分配给在任何类别中没有意义的测试值?

顺便说一句,我意识到另一种可能是创建一个模型来对测试数据进行分类,但是我想看看是否有一种方法可以在XGB模型中解决这个问题。

EN

回答 1

Data Science用户

发布于 2018-02-09 18:45:01

例如,您可以使用目标"multi:softprob“而不是"multi:softmax”。模型是相同的,但是如果是最可能的标签,则会得到每个标签的概率。然后,您可以指定一个阈值,例如0.5,并返回“未知”,如果没有任何概率超过限制。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/27655

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档