前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >R语言Outliers异常值检测方法比较

R语言Outliers异常值检测方法比较

作者头像
拓端
发布2023-12-02 14:40:23
1000
发布2023-12-02 14:40:23
举报
文章被收录于专栏:拓端tecdat拓端tecdat

关于异常值方法的文章结合了理论和实践。理论一切都很好,但异常值是异常值,因为它们不遵循理论。如果一种方法发现我们都认同的异常值,那么这种方法可以认为是不错的。

异常值概述(O3)图旨在帮助比较和理解异常值方法的结果。

Stackloss数据集的O3图。每个变量组合(由左边的列定义)一行,找到了异常值,并将每个案例的一列标识为异常值(右边的列)。


点击标题查阅往期内容

01

02

03

04

威尔金森的算法为整个数据集找到了6个离群值(图的最下面一行)。总体而言,对于各种变量组合,发现14个案例是潜在的异常值 。

O3plot,用于比较标识的异常值。

在OutliersO3中有四种其他方法可用, :

代码语言:javascript
复制
##    HDo    PCS    BAC adjOut    DDC    MCD
##    14      4      5      0      6      5

R中还有其他异常方法,他们会给出更多不同的结果。必须谨慎。离群值本身可能是有趣的,但也可能判断错误。

本文选自《R语言Outliers异常值检测方法比较》。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 拓端数据部落 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 关于异常值方法的文章结合了理论和实践。理论一切都很好,但异常值是异常值,因为它们不遵循理论。如果一种方法发现我们都认同的异常值,那么这种方法可以认为是不错的。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档