如何在pandas中不带NaT的情况下按其他列分组并获取最后一个日期？

在pandas中，可以使用groupby方法按照其他列进行分组，并使用last方法获取每个分组中的最后一个日期。为了避免包含NaT（Not a Time）的情况，可以使用dropna方法在分组之前删除包含NaT的行。

以下是一个示例代码：

import pandas as pd

# 创建示例数据
data = {'Group': ['A', 'A', 'B', 'B', 'C'],
        'Date': ['2022-01-01', '2022-01-02', '2022-01-03', 'NaT', '2022-01-05']}
df = pd.DataFrame(data)

# 将日期列转换为日期类型
df['Date'] = pd.to_datetime(df['Date'])

# 删除包含NaT的行
df = df.dropna(subset=['Date'])

# 按Group列分组并获取每个分组的最后一个日期
result = df.groupby('Group')['Date'].last()

print(result)

输出结果为：

Group
A   2022-01-02
B   2022-01-03
C   2022-01-05
Name: Date, dtype: datetime64[ns]

在这个例子中，我们首先将Date列转换为日期类型，然后使用dropna方法删除包含NaT的行。接下来，使用groupby方法按照Group列进行分组，并使用last方法获取每个分组的最后一个日期。最后，打印输出结果。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体品牌商，无法提供相关链接。但是，腾讯云也提供了丰富的云计算产品和服务，你可以通过访问腾讯云官方网站或搜索腾讯云相关文档来了解更多信息。

作者：ROGER HUANG 本文翻译自：http://code-love.com/2017/04/30/excel-sql-python/ 来源：https://www.jianshu.com/p/51bb7726231b 本教程的代码和数据可在 Github 资源库中找到。有关如何使用 Github 的更多信息，请参阅本指南。数据从业者有许多工具可用于分割数据。有些人使用 Excel，有些人使用SQL，有些人使用Python。对于某些任务，使用 Python 的优点是显而易见的。以更快的速度处理更大

上一篇文章一场pandas与SQL的巅峰大战中，我们对比了pandas与SQL常见的一些操作，我们的例子虽然是以MySQL为基础的，但换作其他的数据库软件，也一样适用。工作中除了MySQL，也经常会使用Hive SQL，相比之下，后者有更为强大和丰富的函数。本文将延续上一篇文章的风格和思路，继续对比Pandas与SQL，一方面是对上文的补充，另一方面也继续深入学习一下两种工具。方便起见，本文采用hive环境运行SQL，使用jupyter lab运行pandas。关于hive的安装和配置，我在之前的文章MacOS 下hive的安装与配置提到过，不过仅限于mac版本，供参考，如果你觉得比较困难，可以考虑使用postgreSQL，它比MySQL支持更多的函数(不过代码可能需要进行一定的改动)。而jupyter lab和jupyter notebook功能相同，界面相似，完全可以用notebook代替，我在Jupyter notebook使用技巧大全一文的最后有提到过二者的差别，感兴趣可以点击蓝字阅读。希望本文可以帮助各位读者在工作中进行pandas和Hive SQL的快速转换。本文涉及的部分hive 函数我在之前也有总结过，可以参考常用Hive函数的学习和总结。

大数据文摘作品，转载要求见文末编译 | 徐宇文，蒋晔、范玥灿卞峥，yawei xia 技术早已成为金融业的一项资产：金融交易的高速、高频与超大数据体量结合，促使金融机构在一年一年不断地加深对技术的关注，在今天，技术已经切实成为了金融界的一项主导能力。在金融界最受欢迎的编程语言中，你会看到R和Python，与C++，C#和Java这些语言并列。在本教程中，你将开始学习如何在金融场景下运用Python。本教程涵盖以下这些方面：基础知识：对于金融入门阶段的读者，你将会首先学到股票和交易策略，什么是时间序列

来源：DeepHub IMBA本文约2300字，建议阅读5分钟本文用25个示例详细介绍groupby的函数用法。 groupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组，分组后的数据可以计算生成组的聚合值。如果我们有一个包含汽车品牌和价格信息的数据集，那么可以使用groupby功能来计算每个品牌的平均价格。在本文中，我们将使用25个示例来详细介绍groupby函数的用法。这25个示例中还包含了一些不太常用但在各种任务中都能派上用场的操作。这里使用

总结了25个Pandas Groupby 经典案例！！

groupby是Pandas在数据分析中最常用的函数之一。它用于根据给定列中的不同值对数据点(即行)进行分组，分组后的数据可以计算生成组的聚合值。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何在pandas中不带NaT的情况下按其他列分组并获取最后一个日期？

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐