我在数值自变量X和数值因变量Y之间有一个关键关系,它就像一个由两个参数决定的负指数函数。还有其他的自变量。一个数字,其余的都是绝对的。
目前我正在使用分位数回归森林。它们运行得很好。然而,上述负指数关系并没有得到保证。
是否有办法达到上述目的。例如,这是否可以被建模为一个分层模型。这里,X上的负指数函数的参数根据其他特征进行调整。实际上,是否可以将其建模为ANN (例如使用KERAS),其中负指数函数是输出层-类似于softmax函数?
任何反馈都是非常感谢的!
发布于 2019-09-12 22:47:23
支持单调性的算法有多种,即可以学习单调性决策规则。
在使用线性回归和logistic回归时,很容易强制执行单调性约束;在优化过程中,您只需强制要求该变量的相应系数是非负的。
xgboost支持单调性约束。但是,请注意,这是“最大的努力”,不能保证整个数据值空间的模型将是全局的100%的单调。
神经网络通过保证权值是非负的,可以支持单调性约束.
我不知道如何使用决策树或随机森林分类器来执行单调性。例如,请参见https://cs.stackexchange.com/q/69220/755的反例,该反例表明,即使您的训练集是单调的,最终的决策树也可能学习非单调规则。
一些参考资料可以查看:https://stats.stackexchange.com/q/257049/2921,https://stats.stackexchange.com/q/342651/2921,https://stats.stackexchange.com/q/341422/2921。
发布于 2019-08-06 14:25:11
这个R包适用于我:
https://cran.r-project.org/web/packages/Rborist/vignettes/rborist.html
可以使用regMono选项。我还得到了分位数回归森林。
https://datascience.stackexchange.com/questions/57027
复制相似问题