我试图用列名绘制某些基于树的模型的特性重要性。我用的是火花呢。
因为我也有文本分类变量和数字变量,所以我不得不使用管道方法,这种方法类似于-
如何将其映射回初始列名和值?这样我才能策划?**
发布于 2018-06-19 23:43:29
用在这里显示提取元数据为user6910411
attrs = sorted(
(attr["idx"], attr["name"])
for attr in (
chain(*dataset.schema["features"].metadata["ml_attr"]["attrs"].values())
)
)
并结合特征的重要性:
[
(name, dtModel_1.featureImportances[idx])
for idx, name in attrs
if dtModel_1.featureImportances[idx]
]
发布于 2018-06-20 21:26:08
转换后的数据集元数据具有所需的attributes.Here是一种简单的方法-
发布于 2020-09-10 16:14:05
在创建汇编程序时,使用了一个变量列表(assemblerInputs)。顺序保留在“特性”变量中。所以,只需做一个熊猫DataFrame:
features_imp_pd = (
pd.DataFrame(
dtModel_1.featureImportances.toArray(),
index=assemblerInputs,
columns=['importance'])
)
https://stackoverflow.com/questions/50937591
复制相似问题