用GroupBy实现熊猫数据帧上的自定义移动平均

GroupBy是pandas库中的一个重要函数，它可以根据指定的一列或多列对数据进行分组。然后，我们可以在每个分组上应用各种聚合函数，如求和、平均值、最大值、最小值等。

要在熊猫数据帧上实现自定义移动平均，我们可以按照以下步骤进行操作：

导入所需的库：

import pandas as pd

创建一个熊猫数据帧：

df = pd.DataFrame({'日期': ['2022-01-01', '2022-01-02', '2022-01-03', '2022-01-04', '2022-01-05', '2022-01-06'],
                   '数值': [1, 2, 3, 4, 5, 6]})

将日期列转换为日期时间类型：

df['日期'] = pd.to_datetime(df['日期'])

对数据帧进行分组，并应用自定义的移动平均函数：

def moving_average(x):
    return x.rolling(window=3, min_periods=1).mean()

df['移动平均'] = df.groupby(['日期'])['数值'].apply(moving_average)

在上述代码中，我们定义了一个名为moving_average的自定义函数，它使用rolling函数来计算移动平均。window=3表示窗口大小为3，即每个分组的前三个值的平均值。min_periods=1表示至少有一个非空值时才计算移动平均。

输出结果：

print(df)

输出结果如下：

          日期  数值     移动平均
0 2022-01-01   1  1.000000
1 2022-01-02   2  1.500000
2 2022-01-03   3  2.000000
3 2022-01-04   4  3.000000
4 2022-01-05   5  4.000000
5 2022-01-06   6  5.000000

在上述结果中，我们可以看到移动平均列包含了每个分组的移动平均值。

这是一个简单的示例，演示了如何使用GroupBy实现熊猫数据帧上的自定义移动平均。在实际应用中，您可以根据具体的业务需求和数据结构来调整代码。

腾讯云相关产品和产品介绍链接地址：

用GroupBy实现熊猫数据帧上的自定义移动平均

、、、、

有一个包含列ID和Feature_1的数据集。Feature_1可以理解为以秒为单位的特定会话持续时间。还有一个自定义函数，它根据窗口宽度导致的NaN数，计算移动平均值，并在开始时加上简单平均值。we calculate only simple average return first_part_result 我们应该在列Featrue_1上应用这个函数，这样我们就可以根据相应ID<

浏览 15提问于2021-04-27得票数 1

回答已采纳

1回答

在Pandas中保存更新的数据帧

、、、、

我第一次使用熊猫。 df.groupby(np.arange(len(df))//10).mean() 我使用了上面的代码，平均每10行取一次。我想保存这个更新后的数据框，但是执行df.to_csv操作就是保存我导入的原始数据框。我还想将我的df (本质上是df.groupby数据帧)中的一列乘以一个数字，并生成一个新列。我该怎么做？

浏览 16提问于2020-10-17得票数 0

回答已采纳

1回答

循环通过具有多个条件的Pandas Dataframe

、

此数据包含最近四周的数据，其思想是基于星期几和时间的总成交量平均值。例如，如果日期=星期一，时间=凌晨1点，则取过去4周的总成交量的平均值。00:30 83 Monday 01:30 8以下是我尝试过的方法或者有没有更好的方法来遍历这个df？

浏览 0提问于2019-04-24得票数 0

1回答

python pandas循环追加数据帧

、、、

我正在尝试创建一个循环，它将分析时间序列数据，并在一个单独的熊猫数据帧中对“每天”数据进行平均。现在，如果我编造了一些假的时间序列数据来获得一个有效的程序：import numpy as np data = p

浏览 13提问于2018-09-06得票数 1

回答已采纳

1回答

在groupby或任何带参数的聚合函数中使用np.average

、、

我现在遇到了一个计算熊猫群体加权平均值的问题。df.groupby(['Group'])['A'].mean()np.average(df.A,weight=df.W) 但是我可以计算每个组的加权平均值吗？

浏览 1提问于2015-07-28得票数 3

2回答

熊猫:从群中创建数据，并在不同的列上同时应用和。

、、

我有以下数据 Gold 5 25 Bronze，得到“数字”和“年龄”的平均值。我可以用两行来做，但是如何用单线和熊猫群在一起。我一次可以做一次手术或 df.groupby(['medal&#

浏览 0提问于2018-11-20得票数 0

回答已采纳

1回答

熊猫如何插值或填充丢失的车价值？

、、、、

我正在使用这个，我对使用哪种方法来填充丢失的价格值有疑问。因为价格是主观的，这也是值得担心的吗？ automobile[mask] = automobile[mask].fillna(mean) 另外，这段代码看起来不太优雅，有没有更好的方法

浏览 2提问于2021-03-23得票数 1

回答已采纳

2回答

熊猫数据中不同事件时、2小时移动平均的计算

、、、

我有一个数据文件，如下所示：Event 01我在dataframe中有很多这样的事件。我怎么能这么做？

浏览 5提问于2017-02-10得票数 3

回答已采纳

1回答

从给定的Dataframe返回排序的Dataframe

、、、

我需要编写一个函数，该函数接受一个名为theData的数据帧、一个名为groupBy的列和另一个名为orderBy的列，并创建另一个表示数据透视表的排序数据帧。它需要被分组为'groupBy‘，并使用orderBy的平均值从大到小进行排序。现在，有一些我无法改变的事实... theData是我解释的数据</em

浏览 16提问于2021-04-19得票数 0

回答已采纳

1回答

查找至少某个值的第一个值

、

我在这上面花了几个小时，所以任何帮助都将是令人惊讶的！我有一个熊猫数据帧df。然后我按其中一列(A)分组，关注另一列(B)，并获得每组的平均值： group_mean = df.groupby('A').B.agg('mean') group = df.groupby('A').B 按照上面的顺序，以下是python报告的类型： <class 'pandas

浏览 2提问于2021-09-04得票数 0

1回答

基于dataframe Python (Pandas)中另一列的值计算列的移动平均值

、、、、

我正在尝试为nba球员创建一个10天移动平均积分的列。我的数据框有每个玩家逐个游戏的统计数据，我希望移动平均列包含该点的10日移动平均线。我试过df.groupby('player')'points.rolling(10,1).mean，，但这只是给了我当天得分的移动平均值，列出了

浏览 12提问于2021-04-23得票数 1

1回答

如何使用for循环for pandas移动窗口

、、、

我有数据帧，我应用了熊猫移动窗口的方法。moving = df.rolling(150, win_type='triang').mean() 上面的代码行可以计算移动窗口的平均值，但我不想要每个移动窗口的平均值。我需要应用循环来处理每个移动窗口，如下所示： for x in moving: #do some process 在python中有没有什么有效

浏览 29提问于2020-04-14得票数 0

1回答

在Dask dataframes中命名返回的聚合列

、、、

当使用pandasv0.25及更高版本时，我可以生成具有自定义名称的聚合列。pandas as pd pd_df = pd.DataFrame(data) 但是，当我尝试使用dataframe做同样的操作

浏览 3提问于2021-11-18得票数 1

回答已采纳

2回答

Pandas -用特定组的平均值替换列中的NaNs

、、

我使用的数据如下所示。数据帧按日期排序： category value Date1 NaN 24/5/2019 1在熊猫身上做到这一点的最好方法是什么？我考虑过的一些方法： 1)这个小即兴小品： df['mean' = df.groupby('category'

浏览 11提问于2019-09-15得票数 3

1回答

蟒极群后指数移动平均的赋值方法

我刚开始在蟒蛇身上使用北极熊，我是从熊猫那里来的。我想知道如何在蟒蛇极地复制下面的熊猫代码import polars as pl 我尝试了以下几点： df.groupby('agg_col&#x

浏览 1提问于2021-12-29得票数 2

1回答

Python - Pandas - Groupby条件组中的列值

、

我有一个具有以下结构的数据帧，其中包含列group_、vals_和dates_。df_.groupby(group_).agg(lambda x: x[x['date_']< some_date][vals_].mean()) 但

浏览 0提问于2017-02-27得票数 0

1回答

pandas数据帧上的滚动PCA

、、

我想知道是否有人知道如何在熊猫数据帧上实现滚动/移动窗口PCA。我环顾四周，发现了在R和MATLAB中的实现，但没有Python。任何帮助都将不胜感激！这不是重复窗口-移动窗口PCA与整个数据帧上的PCA不同。如果您不了解其中的区别，请参阅pandas.DataFrame.rolling()

浏览 23提问于2017-08-29得票数 3

2回答

我如何能够基于标签将DataFrame分割成多个DataFrames，然后对每个DataFrame进行计算？

、、

我有以下DataFrame：我试图为df1'Tub‘中的每个唯一值创建一个DataFrame。现在，我正在创建一个字典，并试图在每个新的DataFrame实例中添加一个匹配的Tub。我认为我的逻辑是正确的。]: tub_df[tub] = pd.DataFrame.copy(df1.loc[tub_row]) 谢谢你的帮助

浏览 0提问于2020-08-13得票数 0

回答已采纳

1回答

Python Pandas组以相同的值替换为

、

我在Python中有一个只有两列的dataframe。1.4 orange 1.1 melon 0.1 melon 1.2 我想要做的是创建一个新的dataframe，其中包含第一个dataframe中每个值的平均值。

浏览 0提问于2015-09-29得票数 2

回答已采纳

1回答

使用pandas groupby，但保持其他列的顺序，然后在组内移位

、、、

假设我有一个熊猫数据帧df，如下所示- a b1 2 673 1 455 3 76 我希望使用groupby，因此生成的数据帧如下所示- a b1 1 983 2 675 3 76 我尝试过df.groupby(['a'

浏览 17提问于2020-12-04得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用GroupBy实现熊猫数据帧上的自定义移动平均

相关·内容

用GroupBy实现熊猫数据帧上的自定义移动平均

在Pandas中保存更新的数据帧

循环通过具有多个条件的Pandas Dataframe

python pandas循环追加数据帧

在groupby或任何带参数的聚合函数中使用np.average

熊猫:从群中创建数据，并在不同的列上同时应用和。

熊猫如何插值或填充丢失的车价值？

熊猫数据中不同事件时、2小时移动平均的计算

从给定的Dataframe返回排序的Dataframe

查找至少某个值的第一个值

基于dataframe Python (Pandas)中另一列的值计算列的移动平均值

如何使用for循环for pandas移动窗口

在Dask dataframes中命名返回的聚合列

Pandas -用特定组的平均值替换列中的NaNs

蟒极群后指数移动平均的赋值方法

Python - Pandas - Groupby条件组中的列值

pandas数据帧上的滚动PCA

我如何能够基于标签将DataFrame分割成多个DataFrames，然后对每个DataFrame进行计算？

Python Pandas组以相同的值替换为

使用pandas groupby，但保持其他列的顺序，然后在组内移位

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐