我正在使用scikit-learn来创建一个随机森林。但是,我希望找到每棵树的各个深度。它看起来像是一个简单的属性,但根据文档,(http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html)没有办法访问它。
如果这是不可能的,有没有办法从决策树模型访问树深度?
任何帮助都将不胜感激。谢谢。
发布于 2015-12-11 08:28:50
每个RandomForestClassifier
实例都有一个estimators_
属性,该属性是DecisionTreeClassifier
实例的列表。文档显示DecisionTreeClassifier
的一个实例有一个tree_
属性,它是(我相信没有文档记录的) Tree
类的一个实例。对解释器的一些研究表明,每个Tree
实例都有一个max_depth
参数,这似乎就是您要查找的参数--同样,它没有文档记录。
在任何情况下,如果forest
是您的RandomForestClassifier
实例,则:
>>> [estimator.tree_.max_depth for estimator in forest.estimators_]
[9, 10, 9, 11, 9, 9, 11, 7, 13, 10]
应该能行得通。
每个估计器还具有一个get_depth()
方法,可用于以更简洁的语法检索相同的值:
>>> [estimator.get_depth() for estimator in forest.estimators_]
[9, 10, 9, 11, 9, 9, 11, 7, 13, 10]
为了避免混淆,应该注意到每个估计器(而不是每个估计器的tree_
)都有一个名为max depth
的属性,该属性返回参数的设置,而不是实际树的深度。下面的示例说明了estimator.get_depth()
、estimator.tree_.max_depth
和estimator.max_depth
之间的关系:
from sklearn.datasets import load_iris
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier(n_estimators=3, random_state=4, max_depth=6)
iris = load_iris()
clf.fit(iris['data'], iris['target'])
[(est.get_depth(), est.tree_.max_depth, est.max_depth) for est in clf.estimators_]
输出:
[(6, 6, 6), (3, 3, 6), (4, 4, 6)]
将最大深度设置为默认值None
将允许第一个树扩展到深度7,输出将为:
[(7, 7, None), (3, 3, None), (4, 4, None)]
https://stackoverflow.com/questions/34214087
复制相似问题