腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1197)
视频
沙龙
1
回答
pandas
数据
帧
中
基于
IQR
的
2组
剔除
异
常值
、
我有一个名为df
的
数据
框,如下所示(实际
数据
框包含数千行),其中列Category有3个唯一值(A,B,C),列Gender有2个唯一值(M,F): ? 我想通过Category和Gender
基于
IQR
来删除Value1和Value2
的
异
常值
。我已经编写了以下函数,用于
基于
IQR
标记列
的
异
常值
: import numpy as np def outliers_
iqr
(col
浏览 37
提问于2021-01-31
得票数 0
4
回答
获取
Pandas
中
按组分列
的
离群数
、
我试图从
Pandas
数据
帧
中
按组获取异
常值
的
数量。 '01/01/2011 10:00:00']})为了获得异
常值
的
数量,我使用以下函数获取
IQR
。def get_
I
浏览 0
提问于2018-02-26
得票数 1
回答已采纳
1
回答
python上有没有一种方法可以用k近邻方法来消除异常?
、
我正在做一个用统计方法检测和纠正异常
的
项目(我仍然是编程
的
初学者),使用K-nn方法我能够检测到存在于我
的
数据
上
的
所有异常,但当我试图删除它们时我阻止了,有人能帮我找到用k-最近邻居方法(我正在使用python)来撤销这些异常
的
方法吗?诚挚
的
问候。
浏览 13
提问于2021-04-20
得票数 2
1
回答
使用dplyr对其他
数据
帧
的
值进行
数据
过滤
、
、
我想从有分组
的
数据
帧
中
检测异
常值
。)方法来确定异
常值
,我为每个组创建了一个包含“上限”和“下限”
的
新
数据
框架。=
IQR
(value), low = q25 - 1.5*
iqr
) 我希望使用quant
的
值来筛选df
数据
帧
,以确定哪些
浏览 1
提问于2022-02-08
得票数 0
回答已采纳
1
回答
必须只传递布尔值错误
的
数据
帧
吗?
、
、
我有一个带有数值
的
各种变量
的
数据
框架(如温度、速度等)。在此,我试图运行一些代码,例如用平均值替换异
常值
和创建一个散点图。但是,我不断得到我在标题中引用
的
错误.我不知道我在哪里出错,因为这段代码已经在其他
数据
帧
上工作了。下面是我
的
数据
框架
的
一个例子:df = pd.DataFrame({'temp': [.2, naN, .12],
浏览 5
提问于2019-09-25
得票数 0
1
回答
使用盒图检测到
的
异
常值
较少
、
、
、
我想用分位数和1.5*
IQR
来确定
数据
帧
中
的
异
常值
。我使用了盒图函数,并将得到
的
异
常值
与使用分位数和
iqr
计算
的
异
常值
进行了比较。 我注意到这两种方法
的
不同之处。盒图方法检测到
的
异
常值
少于Q1-1.5*
IQR
,Q3+1.5*
IQR
计算。我已经尝试将range设置为1.5,但它仍然可以检测到较少
的</em
浏览 3
提问于2016-08-03
得票数 0
回答已采纳
1
回答
Pandas
将函数应用于列表
中
的
多个列
、
、
、
、
我正在尝试创建一个函数,该函数创建一个修改后
的
数据
帧
,其中删除了存储在变量num_vars
中
的
列
中
的
所有异
常值
。')
IQR
= Q3 - Q1 ceilin
浏览 13
提问于2021-03-16
得票数 1
2
回答
在[R]
中
获取错误-需要TRUE/FALSE
的
位置缺少值
、
我正在尝试使用
IQR
计算范围来逐步通过一个向量来查找异
常值
。当我运行这个脚本查找
IQR
右边
的
值时,我得到了结果,当我运行到左边时,我得到了错误:需要TRUE/FALSE
的
地方缺少值。我怎样才能
剔除
数据
集中
的
真与假?(data))
IQR
<-
IQR
(data) paste("the innne
浏览 3
提问于2012-10-22
得票数 1
回答已采纳
3
回答
如何使用方框图删除异
常值
?
、
、
、
、
我有按公制分组日期
的
数据
。我已经绘制了
数据
,现在,如何删除框图范围之外
的
值(离群值)?📷
浏览 0
提问于2019-07-01
得票数 13
回答已采纳
2
回答
函数来删除python
中
的
异
常值
。
、
、
、
、
我正在尝试编写一个函数来使用interquartile范围更新dataset中所有列
中
的
所有异
常值
。当我传递一个列作为输入时,它是有效
的
,但是如果我添加另一个循环来迭代所有列,它就不起作用了。"colnames ",i) print(xy) Q1,Q3=np.percentile(xy,[25,75]) #print(
IQR
) minimum=Q1
浏览 0
提问于2018-07-05
得票数 2
18
回答
检测并排除
pandas
DataFrame
中
的
异
常值
、
、
、
、
我有一个有几列
的
熊猫
数据
框。例如实现这一目标的优雅方法是什么?
浏览 772
提问于2014-04-21
得票数 277
1
回答
R:使用列表来修剪离群值
、
、
、
我有一个由11个
数据
帧
组成
的
列表,每个
帧
都有44个变量
的
sames结构。其中一个变量是比率,我正在尝试修剪包含异
常值
的
记录。我已经能够得到使用以下代码
的
上、下界。)> lower[1] 0.1885 [1] 0.2245 $`Yr10.25
浏览 4
提问于2015-11-17
得票数 0
回答已采纳
1
回答
将异
常值
和空白列表转置到新表
、
、
我希望写一个程序,它将运行多列
数据
,并根据那些被发现为异
常值
和空白
的
数据
创建一个新
的
数据
框架。目前,我有下面的代码,它将用“异
常值
”和“无
数据
”替换这些值,但我正在努力将其转换为新
的
数据
帧
。请求
的
可视化: ? import
pandas
as pd # Remove Initia
浏览 17
提问于2019-01-24
得票数 0
1
回答
高维二元分类问题中如何改进基线logistic回归?
、
、
有关
数据
集
的
信息:所有的特征都是数值。稳健标量Logistic回归标准标量- PCA (解释83%方差
的
n_compo
浏览 0
提问于2021-05-08
得票数 1
2
回答
如何使用
IQR
从DataFrame中去除异
常值
?
、
、
、
我有很多列(大约100个特征)
的
Dataframe,我想要应用四分位数方法,并希望从
数据
帧
中
删除异
常值
。我正在使用此链接当我尝试这样做
的
时候Q3 = stepframe.quantile(0.75)((stepframe < (Q1 - 1.5 *
IQR
)) | (stepframe > (Q3
浏览 6
提问于2018-05-22
得票数 7
回答已采纳
1
回答
R函数
中
的
Boxplot
我有一个计算
IQR
异
常值
的
函数,需要添加一个箱线图作为副作用。到目前为止,我已经有了它,并且它工作正常,但是它也打印出一堆关于boxplot
的
信息,这是我不想要
的
。
IQR
.outliers <- function(x) { stop("x is missing values") stop("x is not numeric") Q3<-
浏览 16
提问于2018-03-04
得票数 0
回答已采纳
2
回答
如何删除同时包含分类
数据
和数值
数据
的
数据
集中
的
异
常值
?
、
、
、
、
我正在尝试从
数据
集中
的
“Price”列
中
删除异
常值
。我已经能够使用其他列
中
的
相应值创建离群值
的
数据
框,但我正在努力从父
数据
集中排除这些条目。我该怎么做呢?这是我用来创建上面提到
的
新
数据
帧
的
代码: lower_limit = pq1 - 1.5 *
iqr
newdf =
浏览 39
提问于2020-09-25
得票数 0
2
回答
异
常值
检测和重命名为NA,使用长格式
的
dplyr
、
我是R编程
的
新手,遇到了一个问题。我想要检测
数据
集中
的
异
常值
,然后将其重命名为"NA“,但找不到正确
的
方法。我使用melt函数将我
的
数据
集转换为长格式,然后使用()
中
的
"isnt_out_tukey“函数(1.5xIQR规则)。 结果是一个带有逻辑表达式("TRUE","FALSE")
的
新列。但在这个新专栏
中
,我需要保留所有非异
常值
浏览 20
提问于2019-10-26
得票数 0
2
回答
如何在
pandas
中
为异
常值
编写用户定义函数
、
、
假设我有一个
数据
框data = pd.DataFrame()data["marks"] = [422,59,75,3,50,4
浏览 11
提问于2019-10-30
得票数 0
2
回答
检测
Pandas
Dataframe
的
所有列
中
的
异
常值
、
、
我正在尝试从每个值被标记为异
常值
的
列中提取索引。我想要
的
是组合所有这些索引,并将它们从我
的
数据
帧
中
删除。我在这里有一个起点。我不确定是应该让函数包含完整
的
数据
集并在其中检测每个列
的
异
常值
,还是应该将其包含在for循环中并将坏
的
索引附加到列表
中
。def find_outliers(df): q3 =
浏览 102
提问于2021-09-20
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
异常值检测和处理
R语言用ARIMA模型滑动时间窗口识别网络流量时间序列异常值
pandas系列学习(五):数据连接
Python商务办公——python+pandas高效实现Excel文件合并与分析
如何只用一行代码让 Pandas 加速四倍?
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券