腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
孤立点检测的邻域计算
、
、
、
、
我正在使用R编程语言,并试图了解用于异常值检测的以下函数的细节: 这个函数(来自"dbscan“库)使用本地
离群
值因子(LOF)
算法
计算异常值:。LOF
算法
是一种无监督的、基于距离的
算法
,它定义了数据集中相对于观测的“可达性和邻域”的异常值。一般说来,相对于邻里的其他观测而言,“很难到达”的观测被认为是一个“
离群
点”。基于这些属性(用户指定这些属性,例如邻域(由“k”表示)可以是"3"),该
算法
为数据集中的每个点分配一个LOF“得分”。对于给定的观测,LOF
浏览 7
提问于2021-02-22
得票数 0
2
回答
2个不等小尺度点集的有效简单匹配
、
、
看起来,大多数
算法
都是为对齐图像而设计的,并且经过修剪,可以处理成千上万个点。我的情况是在这两组中每组都有50到150分。到目前为止,我已经熟悉了Iterative Closest Point和Procrustes Matching
算法
。对于这么小的数量,
实现
Procrustes algorithms似乎是一个完全的过度。ICP有很多
实现
,但我还没有发现任何易于
实现
的版本可以解释所谓的“
离群
点”--没有匹配的对。除了
实现
开销之外,像Fractional和Sparse I
浏览 0
提问于2013-10-21
得票数 2
回答已采纳
2
回答
方法查找数据的“最干净”子集,即可变性最低的子集
、
、
我还了解
JAVA
、一些程序集和fortran。 数据集本身并不庞大,但大约有1.5亿个,所以蛮力可能不是最好的方法。
浏览 0
提问于2009-04-05
得票数 1
回答已采纳
1
回答
二维数据的聚类方法,该方法能够自动检测簇数并处理异常值。
、
、
假设我有类似的数据:我正在寻找一种能够执行聚类的方法或
算法
(例如,如图中所示),该方法或
算法
可以自动确定簇的最佳数目,同时也考虑到
离群
值。最好是在Python中对方法或相关
实现
/库/管道提出建议。
浏览 0
提问于2021-04-30
得票数 0
2
回答
磁盘空间使用的
离群
点检测
、
、
、
、
有几种
离群
点分析方法(参考链接):基于Z分数以上方法是更多的统计方法来检测
离群
点。有几种方法使用无监督机器学习
算法
来检测
离群
点(参考链接)。我应该
实现
无监督的机器学习
算法
还是统计方法?
浏览 0
提问于2019-05-16
得票数 1
2
回答
GPS数据平滑与
离群
点去除
、
、
、
、
此外,偶尔我们也会得到一个
离群
点,即一个远离实际轨迹的错误数据点。 我正在寻找一个
算法
,可以在实
浏览 12
提问于2015-11-30
得票数 3
4
回答
数据挖掘中的孤立点检测
、
、
关于
离群
点的检测,我有几个问题: 我们可以使用支持向量机或任何其他监督学习
算法
来检测
离群
点吗?
浏览 7
提问于2011-05-17
得票数 12
1
回答
使用python进行高维孤立点检测
、
、
谁能给我介绍一个健壮的python
实现
算法
,比如Robust-PCA或基于角度的
离群
值检测(ABOD)?我尝试了几个Robust-PCA的python
实现
,但它们被证明是非常占用内存的,程序崩溃了。R有一个ABOD的
实现
,但我想坚持使用python。
浏览 0
提问于2017-07-14
得票数 3
4
回答
在决策树中处理异常值和空值
、
、
、
离群
值:据我所知,决策树对异常值是稳健的。有人能证实我的假设是否正确吗?(如果我的特征从0到9不等,但存在一个值为10000的异常值,那该怎么办?)它是否为这个
离群
点样本创建了一个单独的叶子,还是会与其他树的叶子合并?谢谢。
浏览 0
提问于2018-05-09
得票数 6
回答已采纳
8
回答
Java
集群库
、
、
我正在寻找一个轻量级的
java
聚类库。我不需要在那个库中有100个集群
算法
,只需要5到7个
算法
就可以了。 我敢肯定,你会问:“你需要什么样的
算法
,目的是什么”:)。
浏览 2
提问于2010-01-25
得票数 21
2
回答
Java
2D极小化
、
我需要帮助写
算法
这样做。样本输入2 45 2样本输出 如果其余的三个点被绘制,它们都可以在一个框内(3×4),因此输出为12;(3 * 4)。如本例所示,行在点上是可以的。然而,
离群
点并不总是最后一点,也不是很大。
离群
点可能很小,只需将面积降到最低。这主要是我需要帮助的
浏览 3
提问于2016-04-03
得票数 1
2
回答
基于数字和分类混合数据的无监督异常检测
、
、
使用聚类
算法
,潜在的“异常值”不也会被分组吗?我怎么才能发现他们呢? 另外,对于涉及到的分类数据,我不确定“点之间的距离”是如何定义的,数据点的接近是否表明了类似的行为?
浏览 2
提问于2015-07-09
得票数 5
1
回答
在拟合凸包前除去孤立点
、
、
估计的KDE如下: 因此,我想移除那些
离群
点。用什么
算法
可以将最小面积凸包拟合成数据集中的n-k点,其中k被设为与给定的观测百分比有关的某个数?
浏览 1
提问于2019-08-20
得票数 0
1
回答
在python / pyspark中获取k-means质心和异常值
、
、
、
、
有谁知道Python / PySpark中的简单
算法
来检测K-means聚类中的
离群
值并创建这些
离群
值的列表或数据帧吗?我不知道如何获得质心。
浏览 57
提问于2021-01-08
得票数 1
回答已采纳
3
回答
Python海运-如何在盒图中确定异常值
、
我想知道用什么
算法
来确定海运中的盒图分布中的“
离群
点”。在他们的网站上,他们简单地说: 谢谢
浏览 1
提问于2017-04-06
得票数 11
回答已采纳
2
回答
算法
: 2D变换,找出
离群
点对并省略
、
、
、
我正在寻找以下类型的
算法
: 在2D中有n对匹配的点。如何根据Affine / Helmert变换识别
离群
点对,并从变换键中省略它们?我们不知道这种
离群
性对的确切数量。哪些类型的
算法
适用于此问题?
浏览 8
提问于2012-02-06
得票数 1
回答已采纳
2
回答
从数据集中排除有噪声的数据来训练模型是个好主意吗?
、
、
从数据集中排除噪声数据(这可能会降低模型准确性或导致意外输出)以生成培训和验证数据集是一个好主意吗?任何建议都是非常感谢的!
浏览 1
提问于2020-04-01
得票数 0
回答已采纳
1
回答
不管参数如何,LOF都会给出相同数量的异常值。
、
、
、
我正在运行lof
算法
大约100k 2d点。每次运行具有不同n_neighbours参数的lof
算法
时,我都会得到与异常值相同的点数。它总是10%的分数作为
离群
点。这个
算法
应该是这样工作的吗?
浏览 0
提问于2018-06-11
得票数 1
回答已采纳
1
回答
机器学习中的空类
、
在滑动窗口方法中,需要进行活动识别,其中每一个时间步骤产生10个类中的一个,然而,实际上,有一些时间步骤没有发生任何事情,因此
算法
不应该进行分类。
浏览 6
提问于2016-04-18
得票数 0
4
回答
决策树对异常值是否稳健?
我读到决策树(我正在使用scikit-learn的分类器)对
离群
点是健壮的。这是否意味着如果我选择不移除异常值,我就不会有任何副作用?
浏览 0
提问于2018-08-24
得票数 5
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一致性Hash算法Java版实现
各种排序算法的分析及java&python实现
八大排序算法总结与java实现
常用的八大排序算法——Java代码实现
你不得不掌握的几种基础排序算法Java实现
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券