我正在使用随机森林从Sklearn的特点的重要性。然而,特征的重要性可能通过改变射频中的random_state参数而改变。我想知道是否有任何方法来获得强大的功能重要性与射频?
发布于 2020-02-11 02:04:05
这是由于随机森林算法的原理。RF通过启发式贪婪方法寻找最优解。在这种启发式的方法下,它减少了具有随机抽样特征和样本的多棵树。在这里,random_state给出了抽样的随机数。如果你看到下面的文件,上面写着
If int,random_state是随机数生成器使用的种子;如果是RandomState实例,则random_state是随机数生成器;如果没有,则随机数生成器是np.random使用的RandomState实例。
[https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html][1]
因此,如果使用固定值设置random_state,则可能具有固定的特性重要性值。它不能保证鲁棒性,因为RF算法不能保证鲁棒性,而是根据其启发式发现给出了答案。
https://stackoverflow.com/questions/60160844
复制相似问题