关于h2o.glm lambda search not appearing to iterate over all lambdas,我读到这个问题是抱怨lambda太高了;他们试图设置early_stopping=F
,希望能修复那个"bug“。
原来的行为不是一个特性,而不是一个bug吗?如果这是正确的,那么在与GLM一起使用交叉验证时应该始终使用early_stopping=T
,否则交叉验证的误差估计是无用的;您还存在过度拟合的风险。
(我的主要问题是,我对GLM和CV一起工作的方式的理解是否正确;但在一起使用lambda_search和交叉验证时,如果还有其他需要注意的事情,我会很感兴趣。)
发布于 2017-08-29 22:57:23
H2O的具有lambda搜索和交叉验证的glm应该始终基于交叉验证选择最好的lambda,并在返回的(主)模型中使用它。提前停止选项应该对选定的lambda没有影响。它的目的是跳过lambdas > best的模型计算,因为主模型不需要它们(我们仍然计算lambdas < best的模型,因为它允许使用热启动并充分利用强规则)。
我认为early_stopping设置为false的行为应该计算所有lambda的模型,以防用户想要查看它们/进行自定义模型选择。
https://stackoverflow.com/questions/45948642
复制相似问题