pandas数据帧中基于IQR的2组剔除异常值_基于数据帧中的两列去除异常值_如何用中值替换Pandas数据帧中的异常值？ - 腾讯云开发者社区

、

我有一个名为df的数据框，如下所示(实际数据框包含数千行)，其中列Category有3个唯一值(A，B，C)，列Gender有2个唯一值(M，F)： ? 我想通过Category和Gender基于IQR来删除Value1和Value2的异常值。我已经编写了以下函数，用于基于IQR标记列的异常值： import numpy as np def outliers_iqr(col

浏览 37提问于2021-01-31得票数 0

4回答

获取Pandas中按组分列的离群数

、

我试图从Pandas数据帧中按组获取异常值的数量。 '01/01/2011 10:00:00']})为了获得异常值的数量，我使用以下函数获取IQR。def get_I

浏览 0提问于2018-02-26得票数 1

回答已采纳

1回答

python上有没有一种方法可以用k近邻方法来消除异常？

、

我正在做一个用统计方法检测和纠正异常的项目(我仍然是编程的初学者)，使用K-nn方法我能够检测到存在于我的数据上的所有异常，但当我试图删除它们时我阻止了，有人能帮我找到用k-最近邻居方法(我正在使用python)来撤销这些异常的方法吗？诚挚的问候。

浏览 13提问于2021-04-20得票数 2

1回答

使用dplyr对其他数据帧的值进行数据过滤

、、

我想从有分组的数据帧中检测异常值。)方法来确定异常值，我为每个组创建了一个包含“上限”和“下限”的新数据框架。= IQR(value), low = q25 - 1.5*iqr) 我希望使用quant的值来筛选df数据帧，以确定哪些

浏览 1提问于2022-02-08得票数 0

回答已采纳

1回答

必须只传递布尔值错误的数据帧吗？

、、

我有一个带有数值的各种变量的数据框架(如温度、速度等)。在此，我试图运行一些代码，例如用平均值替换异常值和创建一个散点图。但是，我不断得到我在标题中引用的错误.我不知道我在哪里出错，因为这段代码已经在其他数据帧上工作了。下面是我的数据框架的一个例子：df = pd.DataFrame({'temp': [.2, naN, .12],

浏览 5提问于2019-09-25得票数 0

1回答

使用盒图检测到的异常值较少

、、、

我想用分位数和1.5*IQR来确定数据帧中的异常值。我使用了盒图函数，并将得到的异常值与使用分位数和iqr计算的异常值进行了比较。我注意到这两种方法的不同之处。盒图方法检测到的异常值少于Q1-1.5*IQR，Q3+1.5*IQR计算。我已经尝试将range设置为1.5，但它仍然可以检测到较少的</em

浏览 3提问于2016-08-03得票数 0

回答已采纳

1回答

Pandas将函数应用于列表中的多个列

、、、、

我正在尝试创建一个函数，该函数创建一个修改后的数据帧，其中删除了存储在变量num_vars中的列中的所有异常值。') IQR = Q3 - Q1 ceilin

浏览 13提问于2021-03-16得票数 1

2回答

在[R]中获取错误-需要TRUE/FALSE的位置缺少值

、

我正在尝试使用IQR计算范围来逐步通过一个向量来查找异常值。当我运行这个脚本查找IQR右边的值时，我得到了结果，当我运行到左边时，我得到了错误:需要TRUE/FALSE的地方缺少值。我怎样才能剔除数据集中的真与假？(data)) IQR <- IQR(data) paste("the innne

浏览 3提问于2012-10-22得票数 1

回答已采纳

3回答

如何使用方框图删除异常值？

、、、、

我有按公制分组日期的数据。我已经绘制了数据，现在，如何删除框图范围之外的值(离群值)？📷

浏览 0提问于2019-07-01得票数 13

回答已采纳

2回答

函数来删除python中的异常值。

、、、、

我正在尝试编写一个函数来使用interquartile范围更新dataset中所有列中的所有异常值。当我传递一个列作为输入时，它是有效的，但是如果我添加另一个循环来迭代所有列，它就不起作用了。"colnames ",i) print(xy) Q1,Q3=np.percentile(xy,[25,75]) #print(IQR) minimum=Q1

浏览 0提问于2018-07-05得票数 2

18回答

检测并排除pandas* DataFrame中的异常值*

、、、、

我有一个有几列的熊猫数据框。例如实现这一目标的优雅方法是什么？

浏览 772提问于2014-04-21得票数 277

1回答

R:使用列表来修剪离群值

、、、

我有一个由11个数据帧组成的列表，每个帧都有44个变量的sames结构。其中一个变量是比率，我正在尝试修剪包含异常值的记录。我已经能够得到使用以下代码的上、下界。)> lower[1] 0.1885 [1] 0.2245 $`Yr10.25

浏览 4提问于2015-11-17得票数 0

回答已采纳

1回答

将异常值和空白列表转置到新表

、、

我希望写一个程序，它将运行多列数据，并根据那些被发现为异常值和空白的数据创建一个新的数据框架。目前，我有下面的代码，它将用“异常值”和“无数据”替换这些值，但我正在努力将其转换为新的数据帧。请求的可视化： ? import pandas as pd # Remove Initia

浏览 17提问于2019-01-24得票数 0

1回答

高维二元分类问题中如何改进基线logistic回归？

、、

有关数据集的信息：所有的特征都是数值。稳健标量Logistic回归标准标量- PCA (解释83%方差的n_compo

浏览 0提问于2021-05-08得票数 1

2回答

如何使用IQR从DataFrame中去除异常值？

、、、

我有很多列(大约100个特征)的Dataframe，我想要应用四分位数方法，并希望从数据帧中删除异常值。我正在使用此链接当我尝试这样做的时候Q3 = stepframe.quantile(0.75)((stepframe < (Q1 - 1.5 * IQR)) | (stepframe > (Q3

浏览 6提问于2018-05-22得票数 7

回答已采纳

1回答

R函数中的Boxplot

我有一个计算IQR异常值的函数，需要添加一个箱线图作为副作用。到目前为止，我已经有了它，并且它工作正常，但是它也打印出一堆关于boxplot的信息，这是我不想要的。IQR.outliers <- function(x) { stop("x is missing values") stop("x is not numeric") Q3<-

浏览 16提问于2018-03-04得票数 0

回答已采纳

2回答

如何删除同时包含分类数据和数值数据的数据集中的异常值？

、、、、

我正在尝试从数据集中的“Price”列中删除异常值。我已经能够使用其他列中的相应值创建离群值的数据框，但我正在努力从父数据集中排除这些条目。我该怎么做呢？这是我用来创建上面提到的新数据帧的代码： lower_limit = pq1 - 1.5 *iqr newdf =

浏览 39提问于2020-09-25得票数 0

2回答

异常值检测和重命名为NA，使用长格式的dplyr

、

我是R编程的新手，遇到了一个问题。我想要检测数据集中的异常值，然后将其重命名为"NA“，但找不到正确的方法。我使用melt函数将我的数据集转换为长格式，然后使用()中的"isnt_out_tukey“函数(1.5xIQR规则)。结果是一个带有逻辑表达式("TRUE"，"FALSE")的新列。但在这个新专栏中，我需要保留所有非异常值

浏览 20提问于2019-10-26得票数 0

2回答

如何在pandas中为异常值编写用户定义函数

、、

假设我有一个数据框data = pd.DataFrame()data["marks"] = [422,59,75,3,50,4

浏览 11提问于2019-10-30得票数 0

2回答

检测Pandas* Dataframe的所有列中的异常值*

、、

我正在尝试从每个值被标记为异常值的列中提取索引。我想要的是组合所有这些索引，并将它们从我的数据帧中删除。我在这里有一个起点。我不确定是应该让函数包含完整的数据集并在其中检测每个列的异常值，还是应该将其包含在for循环中并将坏的索引附加到列表中。def find_outliers(df): q3 =

浏览 102提问于2021-09-20得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云