我已经读过这个问题了:How should we interpret the results of the H2O predict function?仍然不明白p1是否是0,1之间的概率,并且可以作为一个回归来使用,并且我可以应用我自己的阈值。
编辑:谢谢你的回答仍然有些混乱,让我们来挖掘一下,假设我的结果Y是0,1,如果Y是数字,我以回归的形式运行它,并且我有一个列作为响应。另一方面,如果Y是因子,则将其作为分类运行,输出为:预测/p0/p1。现在,p1是否与使用Y作为数字相同?另外,model.html calibrate_model参数会影响逻辑损失,但现在最大F1仍然用作P0 P1或校准概率的阈值?我可以使用校准的概率进行回归,因为逻辑损失被认为是较少的?
发布于 2018-02-22 07:10:16
H2O二进制分类问题的输出将给出类标签(其中阈值设置为获得最大F1评分)、0类的预测值(p0)和1类的预测值(p1)。
这些预测值是未加标记的概率,如果您想要实际的概率,则需要将H2O的模型参数calibrate_model
设置为True。
因此,要回答您的问题,是的p1
是0到1之间的预测值(例如,您将看到.23、.45之类的值。、.89等)因为H2O构建了回归树,所以在技术上可以使用1-p0
获取p1
值(反之亦然),实际上,除非您设置了binomial_double_trees = True
,否则H2O就是这样做的:它为其中一个类构建一个回归树,然后使用1-(该类值)来获取另一个类的预测值。
https://stackoverflow.com/questions/48925902
复制