腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
删除
group
by
之后
的
异
常值
,
然后
计算
每个
组
的
平均值
r
、
dplyr
、
tidyverse
、
tidyr
我有一个数据帧,我希望首先对特定
的
列(ID)进行分组,
然后
根据
组
从特定
的
列(数字)中
删除
异
常值
,
然后
计算
每个
组
的
平均值
。na.rm) y[x < (qnt[1] - val)] <- NA y
gro
浏览 13
提问于2020-07-06
得票数 0
回答已采纳
2
回答
熊猫-用平均群代替离群人
python
、
pandas
我有一个熊猫数据,我想把它分成几组,
计算
平均值
和标准差,
然后
用
组
的
平均值
替换所有的异
常值
。离群值
的
定义是这样
的
,如果它们离群
平均值
超过3个标准差。pandas.DataFrame({'a': ['A','A','A','B','B','B','B'],
浏览 2
提问于2014-12-24
得票数 3
回答已采纳
2
回答
如何在SQL中求出
每个
组
的
平均值
并
计算
出异
常值
mysql
、
sql
、
statistics
、
aggregate
我
的
数据就是这样
的
:------------------2 | 8 | def4| 8 | ghi6 | 10 | ghi 我需要
计算
每组
的
平均数,其中不包括异
常值
(例如id =3表示
组
= abc)。
然后
显示
平均值
旁边
的
外显值。对于上述数据,我期
浏览 6
提问于2016-08-15
得票数 2
回答已采纳
1
回答
平均复杂度
powerbi
、
report
、
business-intelligence
、
powerbi-desktop
*一个汽车模型有一个名称,并且属于一个
组
,所以一个
组
可以拥有n个汽车模型。 事件具有开始日期和结束日期。我在选项卡事件中添加了一个列来
计算
这两个日期之间
的
间隔(名为Treating ).Then,我创建了一个度量来
计算
治疗时间
的
平均值
(名为TREATING Average),我将其用作条形图中
的
值,并将属性
组
设置为轴因此,我有
每个
小组处理一个事件所需
的
平均时间。所以每一
组
都有不同<
浏览 1
提问于2020-01-03
得票数 0
1
回答
在谷歌单张中只识别异
常值
的
功能是什么?
google-sheets
我知道TRIMMEAN函数可以帮助将异
常值
自动排除在
平均值
之外,但是是否有一个只会识别哪些数据点是真正
的
离群点呢?我
的
工作是在经典定义
的
离群值为3 SD,远离
平均值
,在25%
的
底部和25%
的
数据。我需要这样做,以验证我
的
R代码确实正在
删除
真正
的
异
常值
,因为我们正在为我们
的
研究目的在我
的
实验室中定义它们。对于识别和移除异
常值
<em
浏览 3
提问于2021-04-12
得票数 0
回答已采纳
1
回答
ggplot2: geom_violin中
的
均值和中位数
r
、
ggplot2
、
mean
、
median
我当时正在绘制小提琴
的
作图,
平均值
和中值如下: stat_summary(fun.y = median, geom = "point", size = 2, color = "red")+ xlab("
Group</
浏览 0
提问于2019-01-24
得票数 1
回答已采纳
1
回答
使用plyr进行拆分、子集拆分,
然后
应用函数并组合。
r
、
plyr
我想知道如何使用plyr来拆分我所拥有的数据,
然后
是拆分
的
子集,
然后
应用我想要
的
函数,
然后
再组合所有的东西。我想,一个例子可以解释我想做得更好
的
地方。下面是我到目前为止一直在做
的
事情(用虚构
的
数据)。这只会从开始
的
整个数据集中移除异
常值
,这是通过从
平均值
中大于2个标准差来定义
的
。summarize, mean = mean(values)
浏览 1
提问于2014-06-25
得票数 0
回答已采纳
1
回答
从分组数据中
删除
异
常值
r
、
quantile
我想按ID对这些数据进行分组,从分组数据(从框图中看到
的
数据)中移除异
常值
,
然后
计算
平均值
。到目前为止,我所做
的
工作如下:summaryBy(Value ~ ID, data = df, FUN = c(mean, medianextreme.threshold.lower & x < extreme.threshold.upper]} filtData = tapply(d
浏览 1
提问于2016-04-26
得票数 0
回答已采纳
1
回答
用分组数据
计算
时间序列异常
r
、
time-series
post 非常有用,但我在我
的
情况下对数据进行了分组。我有一个包含年份、
组
、值和列
的
数据框架。
每个
组
每年都有一个值。我想
计算
的
是每组
的
年异常。即,今年
的
数值减去该群体所有年份
的
平均值
。最好将这个异
常值
作为数据帧中
的
列来附加。谢谢!2000, 2000,2001, 2001, 2001, 2001, 2001,2002, 2002, 2002, 2002, 2002
浏览 1
提问于2016-02-04
得票数 0
回答已采纳
1
回答
将指标添加到顶部和底部10%
oracle
、
outliers
、
case-statement
我试图捕获FIRST_CONTACT_CAL_DAYS
的
平均值
,但我想要做
的
是为顶部和底部10%
的
值创建一个指标,以便从我
的
平均
计算
中排除这些(离群值)。 不知道该怎么做,有什么想法吗?
浏览 13
提问于2017-06-15
得票数 0
回答已采纳
1
回答
群
的
加权均值不等于熊猫群
的
总均值。
numpy
、
pandas-groupby
、
mean
我在
计算
熊猫数据
的
加权
平均值
时遇到了一个奇怪
的
问题。我想做以下几个步骤:(2)
计算
每组数据
的
加权均值。问题是,当我执行步骤2时,
组
均值(按
每个
组
的
成员数加权)与所有数据
的
加权
平均值
(步骤1)不相同。从数学上讲应该是()。下面我提供了一个简单
的
例子来说明这个问题: 我
的
浏览 5
提问于2021-03-30
得票数 0
回答已采纳
4
回答
显示具有最小
平均值
SQL Server
的
组
sql-server
、
average
我需要创建一个查询,它返回一个列
的
平均值
最小
的
组
。 你能告诉我如何做到这一点吗?提前感谢
浏览 0
提问于2016-10-03
得票数 0
1
回答
为神经网络去除数据中
的
异
常值
,是好还是坏?
python
、
neural-network
、
outliers
我有一些有异
常值
的
数据。然而,我
的
数据有方向,有趋势,在寻找异
常值
时需要考虑这些趋势。然而,异
常值
不仅仅是一个是或否
的
答案。我能说
的
唯一一件事是,一个数据点离趋势越远,它就越有可能是我不想包含在我
的
数据中
的
异
常值
。我可以使用各种技术选择好
的
异
常值
,但问题是,无论何时你去除异
常值
,你都是在使用你从中挑选异
常值
的
数据
的</e
浏览 3
提问于2019-07-31
得票数 0
1
回答
R中按列和因子
删除
离群值行
r
、
dataframe
、
dplyr
、
filtering
、
outliers
(1)我
的
数据帧df还有一个列'
Group
',它指定了一个类标签。我希望能够根据列内
组
内
的
均值和标准差,即按系数(列内)组织,
删除
异
常值
。因此,如果在指定
的
列/属性中,该行
的
值超出
平均值
(该列中A
组
的
行)加上/减n*stdev (该列中A
组
的
行),则将从数据帧中移除带有
组
A标记
的
行。B,C
浏览 4
提问于2020-05-04
得票数 1
3
回答
用dplyr对值进行汇总,并作为向量存储在数据帧中?
r
、
dplyr
、
aggregate
我有一个简单
的
data.frame,如下所示:1 1 90 80,在一个
组
中跨人崩溃(即第1
组
的
Score_1
平均值
,第2
组
的
Score_1
平均值
等等),
然后
我需要在所有
组
之间折叠以求Score_1
的
平均值
。如何
计算</e
浏览 4
提问于2017-02-17
得票数 1
回答已采纳
1
回答
如果超出限制,熊猫会递归地从每一行中
删除
值。
python
、
pandas
我正在处理一个数据集,它每隔5分钟就有来自多个传感器
的
温度值。要求是这与我发现
的
整个行被
删除
的
其他答案不同--我只需要依次
删除
最高
的
异
浏览 3
提问于2022-10-26
得票数 0
1
回答
熊猫统计离群点
的
识别:群和个别栏
python
、
pandas
、
pandas-groupby
、
stdev
我试图了解如何识别统计异
常值
,我将发送到电子表格。我需要按索引对行进行分组,
然后
为特定
的
列查找stdev,任何超过stdev
的
内容都将用于填充电子表格。','F'], 'Age': [33,42,19,64,12,30,32], 'Height': ['163','167','184','164','162','158','1
浏览 7
提问于2017-08-28
得票数 4
回答已采纳
2
回答
如何用最大非异
常值
替换离群值?
python
、
scikit-learn
、
anomaly-detection
、
outlier
、
data-imputation
当我检测到变量
的
异
常值
时,我知道值应该是最高
的
非异
常值
(即,如果没有异
常值
,则是最大值)。第二,这是个坏主意吗?我看到其他人完全
删除
了离群点,或者用
平均值
或中间值代替。我想知道我
的
做法是否错误。
浏览 0
提问于2019-09-24
得票数 0
回答已采纳
3
回答
熊猫,分组数据和标准化值在每一
组
python
、
pandas
、
dataframe
我有一个csv文件,其中包含由ID标识
的
不同组,如下所示:aaa,3aaa,4bbb,54我需要:
计算
每个
组
中x
的
平均值
;将x
的
每个
值除以该特定
组
的
x
的
平均值
。所以,在我上面的例子中,'aaa‘
组
的
平均值
是4,而在'bbb’中是52。我需要获得一个带
浏览 2
提问于2020-12-21
得票数 0
回答已采纳
1
回答
我如何用其各自
的
类均值来
计算
dataframe中
的
每一列?
python
、
pandas
、
mean
、
imputation
如果在标有“
组
标签”
的
列中有两个
组
(0和1),那么如何根据该
组
计算
其他列
的
类
平均值
,而不是根据整个列
的
平均值
计算
类
的
平均值
?这是我到目前为止所掌握
的
代码,它将DF分成两
组
,但没有
计算
正确
的
平均值
: df1 = df.groupby("
group
_label"
浏览 5
提问于2022-10-07
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
java集合的组内平均值怎么计算
DataFocus 与数据对话之均值和中位数
走进大数据 浅谈数据清洗
基因芯片小知识(二)数据分析
Kafka consumer 解析
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券