对于scikit-LearchVersion0.19.1,在隔离林中没有计算特性重要性的实现。我也很难找到任何在线资源,提出解决问题的方法。有没有人知道这样做的方法,或者有什么建议?
以下是我一直在思考的一些想法:
所有的见解都欢迎。谢谢!
发布于 2022-06-15 08:12:15
隔离林算法由于其有效性和计算复杂度低,是目前异常检测领域中最常用的算法之一。影响隔离林的一个主要问题是缺乏可解释性,这是隔离林的组成部分隔离树所表现出的固有随机性的影响。在本文中,他们提出了有效的,但计算费用低廉的方法,以确定特征重要性评分在全球和地方两级隔离森林。此外,他们还定义了一种基于可解释性方法的异常检测问题的无监督特征选择过程,该过程也解决了无监督异常检测中特征重要性评价的挑战性任务。论文增加了几个合成和真实数据集的性能,包括与最先进的解释技术的比较。
@article{carletti2020interpretable,
title={Interpretable anomaly detection with diffi: Depth-based feature importance for the isolation forest},
author={Carletti, Mattia and Terzi, Matteo and Susto, Gian Antonio},
journal={arXiv preprint arXiv:2007.11117},
year={2020}
}
https://doi.org/10.48550/arXiv.2007.11117
文件"基于扩散的可解释异常检测:基于深度的隔离森林特征重要性“的代码。
https://datascience.stackexchange.com/questions/34115
复制