Pandas中的Groupby ID，并获取另一列中最新日期和值大于0的行

在Pandas中，Groupby ID是一种基于ID进行分组的操作。它可以将数据集按照ID进行分组，并对每个组进行聚合操作。

首先，我们需要导入Pandas库并读取数据集。假设我们有一个名为df的数据集，其中包含ID、日期和值三列。

import pandas as pd

# 读取数据集
df = pd.read_csv('data.csv')

接下来，我们可以使用Groupby ID来对数据集进行分组。假设我们要根据ID列进行分组。

# 按照ID进行分组
grouped = df.groupby('ID')

然后，我们可以使用聚合函数来对每个组进行操作。根据问题描述，我们需要获取另一列中最新日期和值大于0的行。

# 获取另一列中最新日期和值大于0的行
result = grouped.apply(lambda x: x.loc[x['日期'].idxmax()][x['值'] > 0])

在上述代码中，我们使用了apply函数来对每个组进行操作。lambda函数用于筛选出最新日期和值大于0的行。idxmax函数用于获取最新日期的索引。

最后，我们可以打印结果或将结果保存到文件中。

# 打印结果
print(result)

# 将结果保存到文件中
result.to_csv('result.csv', index=False)

以上就是在Pandas中使用Groupby ID并获取另一列中最新日期和值大于0的行的完整答案。

关于Pandas的更多信息和使用方法，你可以参考腾讯云的相关产品和文档：

Pandas中的Groupby ID，并获取另一列中最新日期和值大于0的行

python、pandas、csv

我有一个csv文件，其中我需要查找最近用户活动不等于0的ID。input.csv： id date userActivity 2 2020-03-309 所需的output.csv id date userActivity 2 2020-03-301 3 202

浏览 48提问于2020-03-31得票数 0

回答已采纳

1回答

Python:根据熊猫数据中的每日数据计算周开始和周结束？

python、python-3.x、pandas、dataframe、pandas-groupby

我有一个不同月份的每日数据集。我想计算周开始(星期日)和周结束(星期六)根据每种产品类型&国家和值应该是该星期的平均数。:00:00 Broad Cur 8 A我试过与群比，但我

浏览 1提问于2021-12-24得票数 2

回答已采纳

1回答

如果另一列中存在大于0的任何值，则需要将值分配给数据框

python、pandas、dataframe、for-loop

我正在使用一个事务数据库查询集，但我无法获取付款的具体日期，所以我尝试用python编写sone代码来为我指定日期。我的第一个想法是在excel中执行此操作，但数据集是800,000+行X excel列，因此使用其他任何方法都不现实。数据集在payments列的某些行中具有值，因此我需要在包含付款金额的行中添加

浏览 14提问于2019-06-30得票数 1

回答已采纳

3回答

Pandas groupby:在pandas groupby groupby中根据另一列的数据选择行后如何选择相邻的列数据？

python、pandas、dataframe、pandas-groupby

对于每个日期，都有针对持续时间的条目(每个日期1-20个)，并列出每个持续时间的项目(100)。每个项目在相邻的列中都有几个关联的数据点，包括一个标识符。对于每个日期，我希望选择最大的持续时间。max duration for each date如果没有groupby，则可以通过查找正确的行来获取数据，例如：row = df['ID<

浏览 17提问于2019-02-22得票数 2

回答已采纳

2回答

如何根据一列中的唯一值将熊猫的数据分割成不同的数据，并在此基础上进行逐字记录？

python、python-3.x、dataframe

我有一个有三列的数据例如，如果我手动键入DF的名称，就会得到正确的输出，那么我想要找出第一个唯一的dataframe的长度35 但是，我正在尝试自动化代码，所以在技术上，我希望像键入名称那样，在数据文件上找到长度和项。我要找<e

浏览 5提问于2020-01-14得票数 0

2回答

熊猫:分组和总和数据，同时增加最小和最大年。

python、pandas、dataframe

请考虑以下数据：from pandas import DataFrame df = pd.DataFrame({'ID': ['A','A','A','B',和sum项-A和ITEM-B进行分组，但我也希望为每个组添加2列以包括最小年和最大年份。我最初的想法是添加两个新列，并

浏览 7提问于2022-02-21得票数 1

回答已采纳

1回答

从pandas* dataframe中选择特定行*

python、numpy、pandas

我在pandas数据帧中执行了group by，以查看每个位置和每个日期有多少行。agg_count = df.groupby(['date', 'location']).count() 现在，我希望看到这个新数据帧中满足特定条件的行。比如说，计数大于50。我如何高效地迭代这个巨大的数据帧来获得这些行？

浏览 1提问于2013-03-26得票数 1

回答已采纳

3回答

如何从pandas* groupby().sum()的输出创建新列？*

python、pandas、group-by、pandas-groupby

正在尝试从groupby计算创建新列。在下面的代码中，我为每个日期获得了正确的计算值(请参阅下面的组)，但是当我尝试使用它创建一个新列(df['Data4'])时，我得到的是NaN。因此，我尝试在数据帧中创建一个新列，其中包含所有日期的Data3和，并将其应用于每个日期<e

浏览 4提问于2015-05-15得票数 114

4回答

我如何使用pandas* agg对布尔值进行求和，并始终得到结果？*

python、pandas、pandas-groupby

我有一个包含bool类型列的数据框。我想使用pandas的groupby和agg函数来获取每个id的True值的数量。我已经做过很多次了，但是结果列的类型似乎取决于数据框。(data=d) print(df.groupby(['id']).agg({'bool': 'sum&#

浏览 0提问于2020-04-03得票数 1

1回答

查找在其他列中包含多个值的行

python、pandas、python-3.6

问题import pandas as pd df = pd.DataFrame({'NO': ['a', 'a', 'b', 'b', 'c', 'c', 'd', 'd',

浏览 2提问于2020-02-25得票数 0

回答已采纳

1回答

更改Pandas数据帧中的值，但保留日期列

python、pandas、dataframe、replace

我在pandas数据框中有一个7列和2557行的数据集。我尝试将所有负值替换为0，将所有大于192的值替换为192。我已经成功地做到了这一点，但是我得到的新数据帧缺少第一行(日期)。我猜它被遗漏了，因为它不被认为是一个数字值？如何在保留日期列的情况下获得包含已更正数据的<em

浏览 12提问于2020-04-06得票数 2

回答已采纳

2回答

熊猫-带门槛的行和柱

python、pandas

如何从带阈值的Pandas表中提取行和列。例如，如何从下面的图像中只获取红色行和红色列作为新的pd表。 

浏览 4提问于2020-07-26得票数 0

1回答

如何将函数应用于数据框列以创建迭代列

python-3.x、pandas

我有带有系统事件时间的id，我已经按id(单个系统)对事件时间进行了分组，并创建了一个新列，如果eventtimes.diff()大于1天，则值为1，否则为0。现在我有了标志，我正在尝试创建一个应用于groupby('ID')的函数，因此新列从1开始，并为新列中的<

浏览 0提问于2017-11-07得票数 1

1回答

如何有效地从熊猫DataFrame中删除“老字号”行？

python、pandas

假设我有一个巨大的pandas.DataFrame和一个CreationDateTime列。该列包含日期时间作为字符串，其值指示其各自行的“年龄”。PRID CreationDate 1 2017-11-29 15:52:08.963 3 2017-11-29 17:5

浏览 0提问于2018-01-22得票数 1

回答已采纳

4回答

Python Pandas:将日期时间列分组为小时和分钟聚合

python、date、pandas

我已经用read_csv加载了我的数据帧，并轻松地将日期和时间列解析、组合和索引到一列中，但现在我希望能够像在excel pivot中所做的那样，仅基于小时和分钟分组来重塑和执行计算。我知道如何重采样到小时或分钟，但它保留了与每个小时/分钟相关联的日期部分，而我只想将数据集聚合到小时和分钟，类似于在excel数据透视表中分组并<

浏览 2提问于2013-04-29得票数 72

3回答

如何从Pandas* dataframe获取具有最大日期的行？*

python、pandas

我有一个Pandas数据仓库，看起来是这样的：我想获取每个不同ID的最大日期行，这样我的最终结果如下所示：我的日期列是数据类型'object‘。我尝试过分组，然后尝试抓取最大值，如下所示： idx = df.groupby(['ID','Item'])['date

浏览 1提问于2018-11-07得票数 12

回答已采纳

2回答

Pandas agg应用具有多个参数的函数

pandas、pandas-groupby、aggregate、apply

如何将函数应用于需要来自groupby数据帧的多个列的参数并返回两个缩放器值的pandas groupby。下面是可重复的示例。最后一行获取f_value import pandas as pdfrom statsmodels.formula.api import ols import plotly.expressf_va

浏览 81提问于2020-08-18得票数 2

回答已采纳

1回答

获得一个列平均值，该值仅为模糊比率高于给定值的行的列平均数。

python、pandas、pandas-groupby、fuzzy-search、fuzzy-logic

我试图为分组熊猫列中的每个值获取另一列的平均值，其中只有1和0列的值高于给定的极限(例如80以上)。0 我正在尝试groupby('col1')，对于新列中的col2估计中的每个<em

浏览 1提问于2020-06-18得票数 1

回答已采纳

1回答

查找至少某个值的第一个值

pandas、pandas-groupby

我在这上面花了几个小时，所以任何帮助都将是令人惊讶的！我有一个熊猫数据帧df。然后我按其中一列(A)分组，关注另一列(B)，并获得每组的平均值： group_mean = df.groupby('A').B.agg('mean') group = df.groupby('A').B 按照上面的顺序，以下是python报告的类型： <class 'pa

浏览 2提问于2021-09-04得票数 0

1回答

Pandas New列返回每个唯一ID的最早数据

python-3.x、pandas、data-cleaning

我有一个三列的数据集(客户ID、交易、日期)。客户ID与交易之间存在一对多的关系。我想添加一个新列，其中包含每个唯一的客户ID的最早购买数据。，会发生另一个异常:然后以值错误结束。它也没有创建一个名为“第一次购买日期”的新列。是否有一种简单的方法来查找列<

浏览 0提问于2019-11-22得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas中的Groupby ID，并获取另一列中最新日期和值大于0的行

相关·内容

Pandas中的Groupby ID，并获取另一列中最新日期和值大于0的行

Python:根据熊猫数据中的每日数据计算周开始和周结束？

如果另一列中存在大于0的任何值，则需要将值分配给数据框

Pandas groupby:在pandas groupby groupby中根据另一列的数据选择行后如何选择相邻的列数据？

如何根据一列中的唯一值将熊猫的数据分割成不同的数据，并在此基础上进行逐字记录？

熊猫:分组和总和数据，同时增加最小和最大年。

从pandas* dataframe中选择特定行*

如何从pandas* groupby().sum()的输出创建新列？*

我如何使用pandas* agg对布尔值进行求和，并始终得到结果？*

查找在其他列中包含多个值的行

更改Pandas数据帧中的值，但保留日期列

熊猫-带门槛的行和柱

如何将函数应用于数据框列以创建迭代列

如何有效地从熊猫DataFrame中删除“老字号”行？

Python Pandas:将日期时间列分组为小时和分钟聚合

如何从Pandas* dataframe获取具有最大日期的行？*

Pandas agg应用具有多个参数的函数

获得一个列平均值，该值仅为模糊比率高于给定值的行的列平均数。

查找至少某个值的第一个值

Pandas New列返回每个唯一ID的最早数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐