腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
数据
帧
中
的
IsolationForest
查找
异
常值
、
、
我想找出我
的
数据
框
中
的
异
常值
。我写了一段代码来告诉我我
的
输入值是否为异
常值
,但我找不到一种方法来检查我
的
数据
是否包含异
常值
。此外,我认为我
的
代码不能很好地工作,因为它表明这些值[1,4,64]不是异
常值
,而我认为它们是异
常值
。5 1 6.009 5 3
浏览 9
提问于2019-10-01
得票数 1
回答已采纳
2
回答
离群点清除隔离林
、
、
、
、
我一直试图
使用
隔离林从
数据
库
中
删除异
常值
,但我不知道如何删除。我已经看到了信用卡欺诈和工资
的
例子,但我不知道如何在每一列上应用它们,因为我
的
数据
库由3862900行和19列组成。我上传了我
的
数据
库
的
头像。我不知道如何在每一列上应用隔离林,然后永久地删除这些异
常值
。 谢谢。
浏览 5
提问于2020-02-09
得票数 3
回答已采纳
1
回答
使用
pandas rows删除
IsolationForest
找到
的
异
常值
、
我
使用
Isolation forest
查找
异
常值
,并将它们赋给变量y_outliers。现在如何从pandas
中
删除具有这些值
的
行?from sklearn.ensemble import
IsolationForest
clf =
IsolationForest
(max_samples=100, contamination = 0.1如果y_outliers是具有1(内部值)和-1 (异
常值
)
的
数组,如何删除行?
浏览 34
提问于2019-05-11
得票数 0
回答已采纳
3
回答
隔离森林滑雪板污染系数
、
、
、
、
我正在
使用
隔离林算法对时间序列
数据
进行无监督异常检测任务。我正在用Python开发它,更详细
的
是
使用
scikit-learn。我在这方面发现了很多例子,但不太清楚
的
是如何在
IsolationForest
的
实例化过程
中
设置污染参数。
数据
集
的
污染量,即
数据
集中异
常值
的
比例。我应该
使用
一些统计技术来确定这个百分比吗?
浏览 0
提问于2019-07-01
得票数 8
1
回答
如何应用具有数值和分类值
的
基于树
的
模型来
查找
离群点
、
、
、
我有一个
数据
集,其中有一列价格,一栏日期,以及各种其他列
的
数值和分类值。我想根据
数据
集中
的
所有列找到异常价格,为此,我决定
使用
隔离林。然而,我
的
问题是,如何
使用
隔离森林找到异常价格?例如,我有一个包含5列
的
dataframe iso_df:PRICE是我希望
查找
异
常值
的
价格列,RIV_VALUES是价格
的
第二列(但我不想为此
查找
异
常值
),ITEM
浏览 0
提问于2023-04-10
得票数 0
1
回答
用
IsolationForest
检测高暗
数据
集异
常值
的
正确方法
、
、
我
使用
以下简单
的
算法来检测给定
数据
集
的
异
常值
( X of 20K samples和16特性),运行以下操作clf.fit(X) # Notice I am using the entire dataset Xprint (clf.predict(X))[ 1 1 1
浏览 2
提问于2017-11-18
得票数 0
回答已采纳
1
回答
隔离林
、
、
、
目前,我正在
使用
Python
中
的
IsolationForest
方法识别
数据
集中
的
异
常值
,但不完全理解sklearn上
的
示例: 具体来说,图到底给我们展示了什么?这些观测已经被定义为正常/离群值--所以我假设等高线图
的
阴影表明观测结果是否确实是一个异
常值
(例如,异常分数较高
的
观测在较暗
的
阴影区域?)。最后,下面的代码部分是如何实际
使用
的
浏览 2
提问于2017-07-06
得票数 4
回答已采纳
1
回答
是否需要拆分隔离林
的
数据
?
、
、
、
、
我有一个由10049972行x19列组成
的
数据
库。我
使用
隔离森林来检测异
常值
,然后创建一个额外
的
列,该列
的
异
常值
设置为-1,我删除了包含异
常值
的
所有行,作为-1,然后删除该列。我
的
问题是:是否需要对隔离林进行培训、测试和验证?另外,是否有人能确认我
的
代码是否有效? import matplotlib.pyplot as plt
浏览 4
提问于2020-02-13
得票数 6
回答已采纳
1
回答
如何训练
isolationForest
模型,给出最小
的
假阳性数?
、
、
在
使用
隔离林进行
数据
异常检测时,应该只
使用
正常
数据
来训练模型,还是将正常
数据
和异常
数据
混合在一起?多变量
数据
异常检测
的
最佳算法是什么?我要最低限度
的
假阳性。 注意:我知道减少假阳性是一个调整模型
的
问题,但我想知道最有效
的
算法。我从博客
浏览 0
提问于2018-04-21
得票数 5
1
回答
我申请离群点调查
、
我
使用
这段代码来
查找
数据
帧
中
的
异
常值
。第一列只是名称(这就是我跳过它
的
原因)。我发现这种方法可以检测出异常点
的
特定位置。out_ind <- which(df$col1 %in% c(out)) 但在我
的
示例
中
,对象"out“不是单个boxplot.stats(x)$
浏览 3
提问于2022-06-29
得票数 0
回答已采纳
1
回答
PCA + k-means导致较小
的
聚类
、
、
、
当我将其放入k-means模型
中
时,我获得了具有两个簇
的
解决方案,每个簇
的
样本略低于一半,然后两个或三个其他簇具有一个或两个样本。通常,这些一次性聚类是异
常值
的
结果,但除了PCA之外,是否还有其他预处理方法可以避免具有一到两个观察值
的
聚类?
浏览 0
提问于2018-04-24
得票数 0
3
回答
如何
使用
隔离林
、
、
、
我正在尝试检测我
的
数据
集
的
异
常值
,我找到了sklearn
的
。我不明白如何
使用
它。我将我
的
训练
数据
放入其中,它给我返回一个具有-1和1值
的
向量。调整参数?下面是我
的
代码: clf =
IsolationForest
(max_samples
浏览 7
提问于2017-03-28
得票数 23
回答已采纳
1
回答
Python
中
的
隔离林
、
、
、
目前,我正在
使用
Python
中
的
来检测
数据
集中
的
异
常值
,而且我还没有完全理解scikit-learn文档
中
给出
的
示例和解释。rng =
浏览 2
提问于2019-02-18
得票数 6
2
回答
用于异常检测
的
隔离林
、
、
、
在这个用于异常检测
的
of
IsolationForest
中
:import matplotlib.pyplot as pltX = 0.3 * rng.randn(100clf.predict(X_train)y_p
浏览 4
提问于2020-02-13
得票数 0
2
回答
sklearn:利用隔离林进行异常检测
、
、
我有一个没有异
常值
的
训练
数据
集:(588649, 896)from sklearn.ensemble import
IsolationForest
clf.fit10%,这是用于滑雪隔离林
的
默认污染参数。请注意,
浏览 7
提问于2017-07-12
得票数 0
回答已采纳
2
回答
如何
使用
隔离森林和结果分数正确识别异常?
、
、
、
下面是我用来设置算法
的
代码:iForest.fit(dataset)现在,由于我不知道污染
的
好值是多少,我想检查一下我
的
分数,并根据分数
的
分布决定
浏览 5
提问于2019-10-03
得票数 2
2
回答
从某一列
中
删除异
常值
、
、
、
我有一个名为bids_data
的
数据
帧
bids_data: Supplier_ID shiper_RFQ0 2305 50003 2307 45005 2302 10000 6 2306 4500 我想从shiper_RFQ
中
删除异
常值
行,并将它们存储在另一个
数据
帧
中
。我尝试转换列表<e
浏览 16
提问于2019-03-20
得票数 2
回答已采纳
2
回答
如何在异常点检测
中
增加权重
、
假设我们有特征A,B,C,D,E来表示孤立点检测模型
中
的
一个观测值。在我们
的
案例
中
,我们
使用
的
是scikit-学习异常点
的
检测。在孤立点检测模型
中
,有增加或减少特征权重
的
方法吗?
浏览 0
提问于2017-09-12
得票数 3
1
回答
隔离森林实现
、
我想
使用
隔离森林来识别我
的
数据
集中
的
异
常值
。如何
使用
所有40个功能并查看异
常值
?
浏览 2
提问于2017-10-17
得票数 2
3
回答
R函数在列
中
寻找离群值
的
百分比?
、
、
我需要创建一个函数来计算
数据
帧
列
中
异
常值
的
百分比。对于离群点,我指的是任何
数据
点与平均值
的
3个以上
的
标准差。 我查看了包,但这并没有将我分类,因为所有的函数似乎都面向
查找
异
常值
,而不是计算异
常值
。有我可以用
的
函数吗?
浏览 4
提问于2015-09-05
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用Python查找目录中的重复文件
逐帧动画在H5中的使用浅析
Excel中的【查找替换】,你真的会使用吗?
tcp/ip模型中,帧是第几层的数据单元?
使用Java在树结构中查找叶子节点的全路径
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券