删除group by之后的异常值，然后计算每个组的平均值

r、dplyr、tidyverse、tidyr

我有一个数据帧，我希望首先对特定的列(ID)进行分组，然后根据组从特定的列(数字)中删除异常值，然后计算每个组的平均值。na.rm) y[x < (qnt[1] - val)] <- NA y gro

浏览 13提问于2020-07-06得票数 0

回答已采纳

2回答

熊猫-用平均群代替离群人

python、pandas

我有一个熊猫数据，我想把它分成几组，计算平均值和标准差，然后用组的平均值替换所有的异常值。离群值的定义是这样的，如果它们离群平均值超过3个标准差。pandas.DataFrame({'a': ['A','A','A','B','B','B','B'], &#x

浏览 2提问于2014-12-24得票数 3

回答已采纳

2回答

如何在SQL中求出每个组的平均值并计算出异常值

mysql、sql、statistics、aggregate

我的数据就是这样的：------------------2 | 8 | def4| 8 | ghi6 | 10 | ghi 我需要计算每组的平均数，其中不包括异常值(例如id =3表示组= abc)。然后显示平均值旁边的外显值。对于上述数据，我期

浏览 6提问于2016-08-15得票数 2

回答已采纳

1回答

平均复杂度

powerbi、report、business-intelligence、powerbi-desktop

*一个汽车模型有一个名称，并且属于一个组，所以一个组可以拥有n个汽车模型。事件具有开始日期和结束日期。我在选项卡事件中添加了一个列来计算这两个日期之间的间隔(名为Treating ).Then，我创建了一个度量来计算治疗时间的平均值(名为TREATING Average)，我将其用作条形图中的值，并将属性组设置为轴因此，我有每个小组处理一个事件所需的平均时间。所以每一组都有不同<

浏览 1提问于2020-01-03得票数 0

1回答

在谷歌单张中只识别异常值的功能是什么？

google-sheets

我知道TRIMMEAN函数可以帮助将异常值自动排除在平均值之外，但是是否有一个只会识别哪些数据点是真正的离群点呢？我的工作是在经典定义的离群值为3 SD，远离平均值，在25%的底部和25%的数据。我需要这样做，以验证我的R代码确实正在删除真正的异常值，因为我们正在为我们的研究目的在我的实验室中定义它们。对于识别和移除异常值<em

浏览 3提问于2021-04-12得票数 0

回答已采纳

1回答

ggplot2: geom_violin中的均值和中位数

r、ggplot2、mean、median

我当时正在绘制小提琴的作图，平均值和中值如下： stat_summary(fun.y = median, geom = "point", size = 2, color = "red")+ xlab("Group</

浏览 0提问于2019-01-24得票数 1

回答已采纳

1回答

使用plyr进行拆分、子集拆分，然后应用函数并组合。

r、plyr

我想知道如何使用plyr来拆分我所拥有的数据，然后是拆分的子集，然后应用我想要的函数，然后再组合所有的东西。我想，一个例子可以解释我想做得更好的地方。下面是我到目前为止一直在做的事情(用虚构的数据)。这只会从开始的整个数据集中移除异常值，这是通过从平均值中大于2个标准差来定义的。summarize, mean = mean(values)

浏览 1提问于2014-06-25得票数 0

回答已采纳

1回答

从分组数据中删除异常值

r、quantile

我想按ID对这些数据进行分组，从分组数据(从框图中看到的数据)中移除异常值，然后计算平均值。到目前为止，我所做的工作如下：summaryBy(Value ~ ID, data = df, FUN = c(mean, medianextreme.threshold.lower & x < extreme.threshold.upper]} filtData = tapply(d

浏览 1提问于2016-04-26得票数 0

回答已采纳

1回答

用分组数据计算时间序列异常

r、time-series

post 非常有用，但我在我的情况下对数据进行了分组。我有一个包含年份、组、值和列的数据框架。每个组每年都有一个值。我想计算的是每组的年异常。即，今年的数值减去该群体所有年份的平均值。最好将这个异常值作为数据帧中的列来附加。谢谢!2000, 2000,2001, 2001, 2001, 2001, 2001,2002, 2002, 2002, 2002, 2002

浏览 1提问于2016-02-04得票数 0

回答已采纳

1回答

将指标添加到顶部和底部10%

oracle、outliers、case-statement

我试图捕获FIRST_CONTACT_CAL_DAYS的平均值，但我想要做的是为顶部和底部10%的值创建一个指标，以便从我的平均计算中排除这些(离群值)。不知道该怎么做，有什么想法吗？

浏览 13提问于2017-06-15得票数 0

回答已采纳

1回答

群的加权均值不等于熊猫群的总均值。

numpy、pandas-groupby、mean

我在计算熊猫数据的加权平均值时遇到了一个奇怪的问题。我想做以下几个步骤：(2)计算每组数据的加权均值。问题是，当我执行步骤2时，组均值(按每个组的成员数加权)与所有数据的加权平均值(步骤1)不相同。从数学上讲应该是()。下面我提供了一个简单的例子来说明这个问题：我的

浏览 5提问于2021-03-30得票数 0

回答已采纳

4回答

显示具有最小平均值SQL Server的组

sql-server、average

我需要创建一个查询，它返回一个列的平均值最小的组。你能告诉我如何做到这一点吗？提前感谢

浏览 0提问于2016-10-03得票数 0

1回答

为神经网络去除数据中的异常值，是好还是坏？

python、neural-network、outliers

我有一些有异常值的数据。然而，我的数据有方向，有趋势，在寻找异常值时需要考虑这些趋势。然而，异常值不仅仅是一个是或否的答案。我能说的唯一一件事是，一个数据点离趋势越远，它就越有可能是我不想包含在我的数据中的异常值。我可以使用各种技术选择好的异常值，但问题是，无论何时你去除异常值，你都是在使用你从中挑选异常值的数据的</e

浏览 3提问于2019-07-31得票数 0

1回答

R中按列和因子删除离群值行

r、dataframe、dplyr、filtering、outliers

(1)我的数据帧df还有一个列'Group'，它指定了一个类标签。我希望能够根据列内组内的均值和标准差，即按系数(列内)组织，删除异常值。因此，如果在指定的列/属性中，该行的值超出平均值(该列中A组的行)加上/减n*stdev (该列中A组的行)，则将从数据帧中移除带有组A标记的行。B，C

浏览 4提问于2020-05-04得票数 1

3回答

用dplyr对值进行汇总，并作为向量存储在数据帧中？

r、dplyr、aggregate

我有一个简单的data.frame，如下所示：1 1 90 80，在一个组中跨人崩溃(即第1组的Score_1平均值，第2组的Score_1平均值等等)，然后我需要在所有组之间折叠以求Score_1的平均值。如何计算</e

浏览 4提问于2017-02-17得票数 1

回答已采纳

1回答

如果超出限制，熊猫会递归地从每一行中删除值。

python、pandas

我正在处理一个数据集，它每隔5分钟就有来自多个传感器的温度值。要求是这与我发现的整个行被删除的其他答案不同--我只需要依次删除最高的异

浏览 3提问于2022-10-26得票数 0

1回答

熊猫统计离群点的识别:群和个别栏

python、pandas、pandas-groupby、stdev

我试图了解如何识别统计异常值，我将发送到电子表格。我需要按索引对行进行分组，然后为特定的列查找stdev，任何超过stdev的内容都将用于填充电子表格。','F'], 'Age': [33,42,19,64,12,30,32], 'Height': ['163','167','184','164','162','158','1

浏览 7提问于2017-08-28得票数 4

回答已采纳

2回答

如何用最大非异常值替换离群值？

python、scikit-learn、anomaly-detection、outlier、data-imputation

当我检测到变量的异常值时，我知道值应该是最高的非异常值(即，如果没有异常值，则是最大值)。第二，这是个坏主意吗？我看到其他人完全删除了离群点，或者用平均值或中间值代替。我想知道我的做法是否错误。

浏览 0提问于2019-09-24得票数 0

回答已采纳

3回答

熊猫，分组数据和标准化值在每一组

python、pandas、dataframe

我有一个csv文件，其中包含由ID标识的不同组，如下所示：aaa,3aaa,4bbb,54我需要：计算每个组中x的平均值；将x的每个值除以该特定组的x的平均值。所以，在我上面的例子中，'aaa‘组的平均值是4，而在'bbb’中是52。我需要获得一个带

浏览 2提问于2020-12-21得票数 0

回答已采纳

1回答

我如何用其各自的类均值来计算dataframe中的每一列？

python、pandas、mean、imputation

如果在标有“组标签”的列中有两个组(0和1)，那么如何根据该组计算其他列的类平均值，而不是根据整个列的平均值计算类的平均值？这是我到目前为止所掌握的代码，它将DF分成两组，但没有计算正确的平均值： df1 = df.groupby("group_label"

浏览 5提问于2022-10-07得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

熊猫-用平均群代替离群人

如何在SQL中求出每个组的平均值并计算出异常值

平均复杂度

在谷歌单张中只识别异常值的功能是什么？

ggplot2: geom_violin中的均值和中位数

使用plyr进行拆分、子集拆分，然后应用函数并组合。

从分组数据中删除异常值

用分组数据计算时间序列异常

将指标添加到顶部和底部10%

群的加权均值不等于熊猫群的总均值。

显示具有最小平均值SQL Server的组

为神经网络去除数据中的异常值，是好还是坏？

R中按列和因子删除离群值行

用dplyr对值进行汇总，并作为向量存储在数据帧中？

如果超出限制，熊猫会递归地从每一行中删除值。

熊猫统计离群点的识别:群和个别栏

如何用最大非异常值替换离群值？

熊猫，分组数据和标准化值在每一组

我如何用其各自的类均值来计算dataframe中的每一列？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐