我在星火MLLib中构建了一个决策树
val dt = new DecisionTreeClassifier().setLabelCol("indexedLabel").setFeaturesCol("indexedFeatures").setImpurity(impurity).setMaxBins(maxBins).setMaxDepth(maxDepth)我是这样展示的:
val treeModel = model.stages(1).asInstanceOf[DecisionTreeClassificationModel]
println("Learned classification tree model:\n" + treeModel.toDebugString)结果是用“feature”而不是我的数据集的实际特征名对树进行文本描述,从而使树不可解释。
有谁能用正确的特征名来显示树的指针,从而使树的可解释性成为可能?谢谢你!!
发布于 2016-07-04 21:56:50
Spark (Lib)决策树模型( 1.6.X版本)不包含特性规范。基本上,您的功能列("indexedFeatures")是一个双数组,其中单个数组元素充当连续拆分阈值。
关联的DataFrame对象中有一些特性规范信息可用。首先,查看"indexedFeatures“列的元数据。如果这还不够,请查看其组成列的元数据,等等。
JPMML-SparkML库可用于导出PMML数据格式的Spark流水线模型。它的引擎执行一些精巧的功能规格收集和(重新)建设工作。
https://stackoverflow.com/questions/38191093
复制相似问题