腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
用
Pyspark
中
的
平均值
处理
异
常值
、
、
我
的
数据框看起来像- id gender age2 m 39df = df.withColumn("new_age", when(condition, (col(&
浏览 28
提问于2020-01-28
得票数 0
1
回答
如何在
pyspark
中用均值替换异
常值
?
、
、
、
、
我想知道如何用均值替换异
常值
。我有了dataframe,我可以找到离群值并过滤行,现在我想用
平均值
替换它。我该怎么做呢?27 03 80 25 46 42 10 16 1
浏览 24
提问于2021-03-29
得票数 0
回答已采纳
1
回答
如何在
pyspark
中
获得均值?
、
、
、
、
alpha") ,(70,'Audio'), (1000,'benz'), (50,'Suzuki'),(60,'Lambo'),(30,'Bmw')],["Cars", "Brand"]) 现在我想找出异
常值
,为此我使用了IQR,得到了如下
的
上下值,并找到了异
常值
: lower, upper = -55.0 145.0 outliers= df.filter((df['Cars
浏览 17
提问于2021-03-30
得票数 0
回答已采纳
3
回答
R函数在列
中
寻找离群值
的
百分比?
、
、
我需要创建一个函数来计算数据帧列
中
异
常值
的
百分比。对于离群点,我指的是任何数据点与
平均值
的
3个以上
的
标准差。 我查看了包,但这并没有将我分类,因为所有的函数似乎都面向查找异
常值
,而不是计算异
常值
。有我可以
用
的
函数吗?
浏览 4
提问于2015-09-05
得票数 2
回答已采纳
1
回答
函数替换Python
中
的
异
常值
。
我需要创建一个函数,
用
该列
的
平均值
+/- 3* StandardDeviation替换数据集中列
中
的
离群值。例如,如果值大于/小于
平均值
+/- 3* StandardDeviation,则识别异
常值
。因此,如果A
中
的
值假设285是上部
的
一个异
常值
,则需要用Mean+ 3* StandardDeviation替换。如果离群点在较低
的
一侧,则需要用均值-
浏览 2
提问于2020-04-26
得票数 0
回答已采纳
1
回答
如何对R
中
的
数据进行规范化
、
、
这是我
的
数据: a b c d e f g <dbl> <dbl> <dbl> <dbl> <dbl但是,由于变量不在可比较
的
范围内,我需要重新调整它们
的
比例。变量
的
分布不是正态
的
,归一化过程也应该对异
常值
具有鲁棒性。那么,对数据进行规范化
的
最佳方法是什么,以便我可以对变量求和,以便为我
的
数据创建
浏览 20
提问于2020-08-10
得票数 0
3
回答
C#
中
的
单应性、内部性/ Emgu CV/ SURF
、
、
如何使用C#
中
的
单应性或其他方法获取匹配眼点
的
内值/异
常值
?我找到matchedFeature了。代码使用HomographyMatrix (单应性)。我想区分内部和异
常值
。在C++
中
: int cvFindFundamentalMat(const CvMat* points1, const CvMat* points2同样,我只需要分离异
常值
浏览 0
提问于2011-01-10
得票数 4
回答已采纳
2
回答
确定数组
中
特定元素
的
和
、
、
、
、
我有一个数组,它存储由用户输入
的
一系列双倍。数组
的
长度是用户
的
选择,因此会发生变化。我将数字放入一个循环中,循环计算
平均值
,并将异
常值
转换为数组
的
最后一个索引。在不存在异
常值
的
情况下,计算一个新
的
平均值
,并将新
的
异
常值
交换到数组
的
第二个最后一个索引。这个循环会被重复,直到剩下一个元素为止。然而,离群点并没有从数组
中
移除,所以我需要在没有异
浏览 0
提问于2015-05-12
得票数 2
回答已采纳
1
回答
如何根据一列中所有其他数字
的
平均值
重置一些异
常值
?
、
、
我需要用
平均值
替换大于
平均值
2倍或小于列中所有其他数字
平均值
的
1/2
的
异
常值
。其中包括两列:我需要将异
常值
(此处为28和20 )替换为Price列中所有其他值
的
平均值
。请任何人给我一个如何
处理
这件事
的
建议。谢谢
浏览 1
提问于2019-10-09
得票数 0
1
回答
python
中
薪资列异
常值
识别和替换
的
最佳方法
、
大熊猫巨蟒
中
ApplicantIncome、CoapplicantIncome、LoanAmount、Loan_Amount_Term列识别和替换异
常值
的
最佳方法是什么。我尝试使用海运盒图
的
IQR,并试图确定出口和填充NAN记录后,采取了ApplicantIncome
的
手段,并填充了NAN记录。试着采取以下组合列(前)组:性别、教育、自营职业、Property_AreaLoan_ID LP001357 Gender
浏览 1
提问于2019-02-27
得票数 0
1
回答
如何在使用python时拒绝包含有条件
的
异
常值
的
窗口?
、
、
、
、
我面临
的
问题是,如何拒绝一个10行
的
窗口,如果其中一个或多个行包含一个离群点,同时使用python大熊猫计算滚动
平均值
?我需要
的
帮助是基于以下场景
的
条件逻辑异
常值
的
上界为15,下界为0,如果窗口中出现异
常值
的
频率大于10%,则拒绝该特定窗口,然后移动;如果窗口中出现异
常值
的
频率小于10%,则接受以下更改: 1)
用
从非异
浏览 3
提问于2020-05-10
得票数 0
2
回答
熊猫-
用
平均群代替离群人
、
我有一个熊猫数据,我想把它分成几组,计算
平均值
和标准差,然后用组
的
平均值
替换所有的异
常值
。离群值
的
定义是这样
的
,如果它们离群
平均值
超过3个标准差。pandas.DataFrame({'a': ['A','A','A','B','B','B','B'], 'b': [1.1,1.2,1.1,3.
浏览 2
提问于2014-12-24
得票数 3
回答已采纳
2
回答
如何用最大非异
常值
替换离群值?
、
、
、
、
当我检测到变量
的
异
常值
时,我知道值应该是最高
的
非异
常值
(即,如果没有异
常值
,则是最大值)。第二,这是个坏主意吗?我看到其他人完全删除了离群点,或者
用
平均值
或中间值代替。我想知道我
的
做法是否错误。
浏览 0
提问于2019-09-24
得票数 0
回答已采纳
1
回答
将timeseries
中
的
离群值重置为3 SD
、
、
域: Python & Pandas列是: 异
常值
大于3SD =
平均值
+3S.D。
浏览 4
提问于2018-11-21
得票数 0
2
回答
创建一个确定异
常值
影响
的
函数
、
我
的
总体目标是演示离群值在数据集
平均值
上
的
差异。我正在尝试创建一个使用异
常值
"k“
的
大小作为输入并输出
平均值
的
函数。基本上,函数需要接受任何值" k“(这是异
常值
),如果x
的
第一个值被替换为k,则返回向量x
的
平均值
。例如,假设数据集是学生总数
的
高度。第一个值应该是71.3厘米,但是孩子不小心放了713厘米。在本例
中
,我希望我
的
浏览 26
提问于2020-09-03
得票数 0
回答已采纳
1
回答
如何用
平均值
替换异
常值
我
的
问题是将列
中
的
所有"True“替换为average。我已经确定了如下异
常值
: high <- mean(df$variable1) + sd(df$variable1) * 3df$Outlier <- (df$variable1 < low | df$variable1 > high) 因此,结果是一个包含一些"True“和"False”
的
列
浏览 23
提问于2020-03-18
得票数 0
1
回答
删除异
常值
,通过方格图计算一个序列/数据
的
平均值
?
、
、
、
、
我试图在没有异
常值
的
情况下计算数据
中
每列(序列)
的
平均值
。在此任务
中
,我使用了“海运”
的
框图:sns.boxplot(x='Unit_Code',y='Leadtime',hue='Has_Weekend,data=df ,palette='winter')这就是我得到<em
浏览 0
提问于2020-11-16
得票数 1
回答已采纳
1
回答
PySpark
中
的
多重滤波
、
、
我已经将数据集导入到Juputer笔记本/
PySpark
中
,以便通过电子病历进行
处理
,例如: 删除统计异
常值
的
行,即从
平均值
中
移除3个标准差。因此,在这里,单元格C4显然需要删除,但我不确定如何将此逻辑合并到过滤
浏览 5
提问于2017-10-05
得票数 0
回答已采纳
1
回答
我们如何用
平均值
和中值来检测异
常值
的
存在?
、
我们如何用
平均值
和中值来检测异
常值
的
存在?假设我有一个数据集,手里有八个特性。我把他们
的
手段和中间的人一排排地并列起来。median 2.5000 0.1826 0.0001 0.0002 0.0000 -0.0000 0.0000 -0.0000数据是如何分布
的</em
浏览 0
提问于2016-11-26
得票数 0
1
回答
使用重复循环查找多个异
常值
?
、
我有一个大但不可靠
的
矩阵形式
的
数据集。我使用包异
常值
来搜索数据集中
的
异
常值
,特别是在我
的
数据矩阵
的
每一行
中
,但是每一行都有多个异
常值
。为了寻找一个以上
的
异
常值
,我尝试使用一个重复循环来替换异
常值
(
用
行
平均值
),直到该行
的
标准偏差低于某个指定值为止。standarddeviationthreshold) {
浏览 4
提问于2014-06-21
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
油浸枕木防腐处理过程中的“高温”有什么用?
PySpark,大数据处理的Python加速器!
机器学习实践:如何将Spark与Python结合?
用Python和OpenCV给图像添加噪点:实现图像处理中的噪声模拟与应对
一个Python大数据处理利器:PySpark入门指南
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券