首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >根据数据帧中的列值比较连续记录

根据数据帧中的列值比较连续记录
EN

Stack Overflow用户
提问于 2022-08-04 02:15:19
回答 1查看 16关注 0票数 0

我有一个像这样的数据框架

代码语言:javascript
运行
复制
df =  pd.DataFrame({'Shipment': ['Washington','Green Gala', 'Green Gala','Dale', 'Chiquita'],
                   'Source':  ['USA', 'SA','NZ', 'GU','EQ'],
                   'Serial No.': ['01','01','01','02','02'],
                   'Freight type':  ['Truck','Air','Sea','Sea','Sea'],
                   'Shipment date': ['2020-01-01','NULL','2020-01-02','2020-02-01','2020-02-01']})

我想找到序列号值相同但装运日期和装运值不同的记录。

从上面的例子中,对于Serial '01‘托运有多个行,它们是华盛顿和格林Gala,并且所有3条记录的发运日期也不同,所以我想保存这些。

对于系列编号'02',我的货物是不同的,但我的装运日期是相同的,所以我将忽略这些。

我的最终数据框架应该类似于

代码语言:javascript
运行
复制
df =  pd.DataFrame({'Shipment': ['Washington','Green Gala', 'Green Gala'],
                   'Source':  ['USA', 'SA','NZ'],
                   'Serial No.': ['01','01','01'],
                   'Freight type':  ['Truck','Air','Sea'],
                   'Shipment date': ['2020-01-01','NULL','2020-01-02']})

EN

Stack Overflow用户

发布于 2022-08-04 02:23:40

代码语言:javascript
运行
复制
df.drop_duplicates(["Shipment date", "Serial No."], keep=False)
代码语言:javascript
运行
复制
     Shipment Source Serial No. Freight type Shipment date
0  Washington    USA         01        Truck    2020-01-01
1  Green Gala     SA         01          Air          NULL
2  Green Gala     NZ         01          Sea    2020-01-02

注:适用于您的示例输入。只需确保它是否适用于所有可能的场景。

票数 0
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/73229668

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档