腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
:
检测
和
打印
数据
帧
中
的
离群
值
、
、
、
我正在尝试识别并
打印
包含异常值
的
数据
帧
的
行。作为一个实验,我正在考虑对列'xy‘下与列'x’下
的
类别'C‘相对应
的
6到10之间
的
所有
值
进行异常值。我不知道为什么,我
的
代码
打印
了一个空输出。import numpy as npimport matplotlib.pyplot as plt data=[[
浏览 19
提问于2021-06-28
得票数 0
1
回答
在python / pyspark
中
获取k-means质心
和
异常值
、
、
、
、
有谁知道Python / PySpark
中
的
简单算法来
检测
K-means聚类
中
的
离群
值
并创建这些
离群
值
的
列表或
数据
帧
吗?我不知道如何获得质心。
浏览 57
提问于2021-01-08
得票数 1
回答已采纳
1
回答
如何根据差异发现异常值?
、
、
我想通过检查两个
值
之间
的
差异来找出我计算
的
河流公里
中
的
异常值,我写了这样
的
代码:print(df2.diff_to_traj.min()) 但当2个
离群
值
逐个出现在
数据
帧
中</
浏览 11
提问于2019-07-25
得票数 0
1
回答
检查
Pandas
Dataframe
中
的
异常值
、
我在一个包含8个电极
的
传感器上做了一个实验。上图是电极输出随时间变化
的
曲线图。正如您在图中看到
的
,8个电极
中
的
一个明显是异常值(可能是由于某些电气故障)。该图是由
Pandas
DataFrame生成
的
,它基本上有10列(1列表示时间,8列表示电极,1列平均8个电极)。 在统计上
检测
某一列是否为异常值
的
最佳方法是什么?我想可以将
离群
列从
数据
帧
中
删除。
浏览 0
提问于2018-01-04
得票数 3
回答已采纳
1
回答
从
数据
报
中
打印
异常值
、
、
我想从我
的
数据
帧
中提取异常值。就像1000个
数据
点中
的
10个,这些
数据
点可能是
离群
点,或者不会在95%
的
置信区间内下降。有一些方法可以找到与样本平均值相差最大
的
值
。> a <- c(1,3,2,4,5,2,3,90,78,56,78,23,345)> outlier(a)我不想从我
的
数
浏览 1
提问于2015-04-01
得票数 1
回答已采纳
1
回答
使用Zscore计算
离群
值
我想在我
的
dataframe df1
中
使用zcore方法保存异常值。我做
的
对吗?
浏览 1
提问于2020-08-07
得票数 1
3
回答
时间序列
中
异常
检测
k-均值
、
、
我试图使用k-方法来
检测
Amount列
中
的
异常。我有我
的
数据
集
的
以下部分:9 2018-10-04 -1149.7311 2018-12--03-06 139.2416 2019-05-07 -30326.58我使用2作为集群
的
数目,并得到以下质心:
浏览 0
提问于2019-06-18
得票数 0
回答已采纳
2
回答
盒形图中
的
自动(须敏) ylim
、
、
、
当用熊猫绘制
数据
栏时,例如:yaxis
的
自动调整会导致大量未使用
的
空间。我想知道这是否是因为dataframe
的
点数超过了方格晶须(但由于某种原因,
离群
点没有显示)。如果是这样的话,有什么好方法可以自动调整ylim,这样就不会有太多
的
空空间了?
浏览 2
提问于2014-05-07
得票数 1
回答已采纳
1
回答
如何针对缩放
数据
从非缩放
数据
中
删除
数据
?
、
我现在使用
的
是R,在这里,我正在缩放原始
数据
,删除所有Z分数为3或更多
的
离群
值
,然后过滤掉未缩放
的
数据
,使其只包含非
离群
值
。我希望在删除
离群
值
后留下一个包含非缩放数字
的
数据
帧
。这就是我
的
脚步: 缩放x,保持y不缩放。这个独特<
浏览 2
提问于2017-07-25
得票数 0
回答已采纳
1
回答
如何以及何时处理
数据
集中
的
异常值(一般策略)
、
、
、
我遇到了以下问题: 我正在做一个
数据
科学
的
初学者项目。我得到了测试
和
训练
数据
拆分,现在我正在分析每个特征,然后将其添加到离散连续变量
的
数据
帧
或连续变量
的
数据
帧
中
。在这样做
的
时候,我遇到了一个
离群
值
很大
的
特征。如果我要删除它们,我已经添加到我
的
子
数据
帧
中
<em
浏览 11
提问于2021-03-25
得票数 1
1
回答
循环通过Dataframe以按城市删除异常值(调用函数)
、
、
、
我有个
数据
框里面有日期,城市,销售额- Date City Sales2008-01-01 C2 2000if np.abs(z_score) > threshold: return outliers 现在,我想使用这个
离群
值
函数从df
中
删除
离群
值
detect_discrete_outliers(df['
浏览 25
提问于2021-08-11
得票数 1
回答已采纳
1
回答
如何使用XGBoost为高度不平衡
的
类构建自己
的
评估指标,以最小化测试错误?
、
、
、
我收集了一个产品在发布管道
中
需要多长时间才能发布
的
数据
。到目前为止,95%
的
数据
花费了<400分钟
的
异常值= 0。然后,5%
的
数据
在700,40000分钟
的
异常值= 1之间。问题是,异常值非常少见,我有大约200个异常值
数据
点
和
3200个非异常值
数据
点。 目前,在没有调整
的
情况下,我
的
模型可以预测98%
的
离群</e
浏览 3
提问于2019-03-05
得票数 1
3
回答
多维孤立点
的
发现
、
、
、
、
我正在处理一个非正态分布
的
数据
集。
数据
集包含成本、折扣
和
利润三个维度。Zscore(cost) + Zscore(profit) - Zscore(dis
浏览 0
提问于2016-04-30
得票数 2
1
回答
移除
离群
值
会在
pandas
数据
帧
中
创建空
值
、
、
我有一个非空
的
dataframe df,它大约有100列。我希望从每一列
中
删除异常值,为此我执行以下操作。df1 = df[np.abs(df - df.mean()) <= (3*df.std())] 我希望df1包含
的
记录数量比df少,但使用上面的方法,形状保持不变。此外,它还创建了一个空
值
lof。我
的
理解是它去除了异常值,但现在我用空
值
代替了异常值。我
的
理解正确吗?
浏览 23
提问于2019-03-19
得票数 0
1
回答
多变量
离群
点
的
剔除
、
、
问题关于异常值,我无法生成结果,因为它注意到我
的
数据
集包含负数,因此无法工作。我不知道如何将我
的
数据
修改为积极<
浏览 2
提问于2017-07-24
得票数 4
回答已采纳
1
回答
从
pandas
dataframe python
中
删除异常值
、
、
我有一段使用
pandas
创建
数据
帧
的
代码import numpy as np y = (g[0].data.f7.400021 False4 -0.825279 7.496021 False 在我
的
数据
示例
中
我
的
问题是:与
浏览 5
提问于2017-08-02
得票数 3
回答已采纳
1
回答
使用langdetect输出导入到我
的
dataframe
中
的
新列
中
、
对于用python编程来说,这是一个相当新
的
过程,我尝试在熊猫
数据
框架
中
检测
文本片段。因此,首先我为'langdetect‘包做了一个函数。import
pandas
as pd lang = detect(x)我
的
第二步是在
数据
帧
中
输入以进行处理。需要
检测
浏览 3
提问于2019-11-29
得票数 1
回答已采纳
1
回答
用
pandas
替换混合
数据
帧
中
的
离群
值
、
、
、
、
我有一个混合了str、int
和
float类型
的
dataframe。我在floats列中有一些异常值,并尝试使用以下命令将它们替换为NaN我也试过用numpy
的
df.index, df.columns)` 但是对于这两个人,我得到了TypeError: unsupported operand type(s) for -: 'str' and 'float'
和
TypeError:
浏览 7
提问于2020-05-20
得票数 0
回答已采纳
1
回答
识别
和
更改组
中
的
极端日期时间异常值
、
我有一段
数据
帧
,用来识别那些没有
和
其他人同时断开连接
的
设备(基本上就是那些忘记挂机的人)。我已经按照UniqueCallID
和
LeaveTime对这个切片进行了排序,因此
离群
值
始终是会议“组”
中
的
最后一个,如果差异超过x个时间量(60分钟或1小时),我希望将该
离群
值
的
LeaveTime更改为前一个
离群
值
的
我有一个UniqueCa
浏览 31
提问于2019-06-28
得票数 1
1
回答
如何从TensorFlow/OpenCV对象
检测
检测
到
的
每个对象触发JSON或pd Dataframe报告
、
、
、
、
我正在构建一个python应用程序,它使用AI来扫描OpenCV
的
实时提要,并跟踪带或不带面具的人。我想问,是否有一种好方法可以为提要中跟踪
的
每个唯一实体发送唯一
的
数据
帧
,以便在
数据
库
中
创建每个人进入
帧
时被跟踪
的
程序性条目,以及他们是否戴着口罩。 有什么建议吗?
浏览 15
提问于2021-04-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
下列关于数据库中“型”和“值”的叙述中,哪一条是错误的
异常值检测和处理
Google机器学习速成课程笔记(一)
在Python中进行探索式数据分析
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券