首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >隔离森林特征重要性

隔离森林特征重要性
EN

Data Science用户
提问于 2018-07-06 17:13:37
回答 1查看 2.7K关注 0票数 5

对于scikit-LearchVersion0.19.1,在隔离林中没有计算特性重要性的实现。我也很难找到任何在线资源,提出解决问题的方法。有没有人知道这样做的方法,或者有什么建议?

以下是我一直在思考的一些想法:

  1. 为每个树中的每个节点计算某种类型的“隔离度量”(例如样本分割的%),并为每个拆分特性获得该度量的平均值。
  2. 模型拟合后,一次对每个特征进行遍历,对该特征的数据进行随机排序,并计算异常分值。然后计算异常分数的平均变化。

所有的见解都欢迎。谢谢!

EN

回答 1

Data Science用户

发布于 2022-06-15 16:12:15

基于扩散的可解释异常检测:基于深度的隔离森林特征重要性

隔离林算法由于其有效性和计算复杂度低,是目前异常检测领域中最常用的算法之一。影响隔离林的一个主要问题是缺乏可解释性,这是隔离林的组成部分隔离树所表现出的固有随机性的影响。在本文中,他们提出了有效的,但计算费用低廉的方法,以确定特征重要性评分在全球和地方两级隔离森林。此外,他们还定义了一种基于可解释性方法的异常检测问题的无监督特征选择过程,该过程也解决了无监督异常检测中特征重要性评价的挑战性任务。论文增加了几个合成和真实数据集的性能,包括与最先进的解释技术的比较。

代码语言:javascript
运行
复制
@article{carletti2020interpretable,
  title={Interpretable anomaly detection with diffi: Depth-based feature importance for the isolation forest},
  author={Carletti, Mattia and Terzi, Matteo and Susto, Gian Antonio},
  journal={arXiv preprint arXiv:2007.11117},
  year={2020}
}
 
https://doi.org/10.48550/arXiv.2007.11117

文件"基于扩散的可解释异常检测:基于深度的隔离森林特征重要性“的代码。

票数 1
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/34115

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档