腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >如何从Pandas dataframe中删除一行中的“A”列等于另一行中的“B”列的行？

问如何从Pandas dataframe中删除一行中的“A”列等于另一行中的“B”列的行？
EN

Stack Overflow用户

提问于 2021-10-16 10:44:05

回答 1查看 65关注 0票数 0

我正试图从重复的行中清理我的熊猫数据帧。我知道如何删除列值相同的行，但如果(第1行的A列等于第2行的B列，第1行的B等于第2行的A列等于第2行的A列)，则如何删除行。我希望这不是太混乱。我在下面添加了一个表格的例子。我认为第2行和第3行是重复的。我怎么用熊猫把它们移走呢？

编辑：

重复的行不一定就在彼此之间。我只需要保留其中的一行(具体而言，哪一行不重要)。

python

pandas

云点播特惠1元起

提供三端 SDK 、云 API、控制台等多种上传方式，弱网环境下文件上传成功率达到 99.5%

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-10-16 11:00:12

使用np.sort使每行按顺序具有相同的值

import pandas as pd
import numpy as np

# toy data
df = pd.DataFrame(data=[[10, 15], [15, 10]], columns=["A", "B"])

# find duplicates rows
duplicated = pd.DataFrame(np.sort(df[["A", "B"]], axis=1), index=df.index).duplicated()

# filter out 
res = df[duplicated]
print(res)

输出

    A   B
1  15  10

另一种方法是使用frozenset将每一行转换为一个可选的集合，而顺序并不重要。

# find duplicates rows
duplicated = df[["A", "B"]].apply(frozenset, axis=1).duplicated()

# filter out
res = df[duplicated]
print(res)

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/69598599

复制

[大佬] 何为"网络"

tcp/ip

1945年，冯诺依曼发明了世界上第一台电子计算机。截止到今天，计算机经过了76年的发展，互联网已把全世界几十亿人所拥有或使用或租用的各级计算机，连接在了一起。同时，也把这么多人的心，局部或全部，给拽进去了互联网内。

科控物联

2022/03/29

2700

HBase RowKey 设计

编程算法 hbase TDSQL MySQL 版数据库 sql

HBase中 RowKey 用来唯一标识一行记录。在 HBase 中检索数据有以下三种方式：

smartsi

2019/11/26

1.8K0

HBase Schema 设计

hbase TDSQL MySQL 版数据库 sql 存储

HBase 与传统关系数据库（例如MySQL，PostgreSQL，Oracle等）在架构的设计以及为应用程序提供的功能方面有很大的不同。HBase 权衡了其中一些功能，以实现更好的可扩展性以及更灵活的模式。与关系数据库相比，HBase 表的设计有很大的不同。下面将通过解释数据模型向您介绍 HBase 表设计的基础知识，并通过一个例子深入探讨 HBase 表的设计。

smartsi

2019/11/26

2.3K0

HBase设计之rowkey设计

hbase 存储 nosql 数据库

HBase应用场景非常广泛；社区前面有一系列文章。大家可以到社区看看看；张少华同学本篇主要讲HBASE最重要的一个基础知识，rowkey的涉及，非常赞！大力推荐！社区系列文章：新数仓系列：HBase关键能力和特性梳理 HBase 和 Cassandra的浅谈新数仓系列：Hbase周边生态梳理（1） HBase由于其存储和读写高性能，在实时查询中越来越发挥重要的作用，但是由于其属于NOSQL数据库类型，对于关系型数据并不适用。HBase查询只能通过其rowkey来查询（我们可以认为是HBa

大数据和云计算技术

2018/03/30

2.4K0

如何为 acala 网络测试

腾讯云测试服务数据分析

Mandala 测试网络是一个无风险和无价值的游乐场，纯粹用于测试功能和“爆炸性”实验。没有网络价值，也没有奖励。您可以获得测试令牌来测试驱动各种功能。

公众号---人生代码

2021/08/26

5400

安装Standalone模式HBase

TDSQL MySQL 版 hbase https 网络安全 zookeeper

所谓Standalone模式HBase，就是只启动一个JVM进程，在这个进程中同时启动了多个后台角色，如：HMaster，单个HRegionServer，以及ZooKeeper服务。

编程随笔

2022/10/28

5260

HBase rowkey设计案例

php http hbase TDSQL MySQL 版 unix

hbase所谓的三维有序存储的三维是指：rowkey（行主键），column key(columnFamily+qualifier)，timestamp(时间戳)三部分组成的三维有序存储。

程裕强

2022/05/06

3650

再谈|Rowkey设计_HBase表设计

hbase TDSQL MySQL 版 javascript unix

HBase的rowkey设计可以说是使用HBase最为重要的事情，直接影响到HBase的性能，常见的RowKey的设计问题及对应访问为：

Spark学习技巧

2019/12/15

1.2K0

HBase原理和设计

hbase

作者：Jiang Hongxiang 来源：比特科技简介 HBase —— Hadoop Database的简称，Google BigTable的另一种开源实现方式，从问世之初，就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存储提供可靠的方案。从功能上来讲，HBase不折不扣是一个数据库，与我们熟悉的Oracle、MySQL、MSSQL等一样，对外提供数据的存储和读取服务。而从应用的角度来说，HBase与一般的数据库又有所区别，HBase本身的存取接口相当简单，不支持复杂的数据存取，更不支

Spark学习技巧

2018/01/31

1.6K0

Hbase RowKey设计原则

hbase

经常查避免热点尽量短，并且尽量长度一致

shengjk1

2018/10/24

8760

硬核课堂：如何为高性能深度学习系统设计网络架构

深度学习高性能架构网络系统设计

用户6874558

2023/09/05

3080

HBase多租户系统设计

访问管理

面向多租户的数据安全和资源隔离能力，提供标准的用户名密码认证、ACL、Quota、Resource Group等特性，看到集群的容量状况，Server列表，表属性，表大小等等信息。在集群管理系统中，可以完成namespace管理、用户管理、ACL管理等功能

sparkle123

2021/01/13

1.1K0

传感器低功耗设计_压力传感器

https java 网络安全

无线温度传感器是常见的传感器，广泛用于各种需要温度检测的场合。对于有线供电的传感器而言，可以实时监测来保证温度在限定范围内。而对于电池供电的温度传感器而言，如果过于频繁的读取传感器，则显然会消耗很多电量，使得电池的使用寿命大大减小。因此，如果温度传感器自身有上下限设定，超越上下限的时候能够触发中断，那对于功耗保持是非常有帮助的。对于一般的-20到100度左右的温度检测，我们可以选用芯片类型的带有中断信号的温度传感器。这样的话，我们可以在传感器内部设定高低温阈值。这样的话，传感器能够实时监测温度不要超越上下限，而同时又比较省电。

全栈程序员站长

2022/09/20

3680

如何为非常不确定的行为（如并发）设计安全的 API，使用这些 API 时如何确保安全

api 安全并发队列设计

.NET 中提供了一些线程安全的类型，如 ConcurrentDictionary<TKey, TValue>，它们的 API 设计与常规设计差异很大。如果你对此觉得奇怪，那么正好阅读本文。本文介绍为这些非常不确定的行为设计 API 时应该考虑的原则，了解这些原则之后你会体会到为什么会有这些 API 设计上的差异，然后指导你设计新的类型。

walterlv

2023/10/22

1750

面试头条：HBASE 存储设计

sql 存储 hbase TDSQL MySQL 版大数据

5、Hbase的表在物理存储上，是按照列族来分割的，不同列族的数据一定存储在不同的文件中

木野归郎

2020/06/12

1K0

HBase的 rowkey 设计原则

hbase 大数据

hbase所谓的三维有序存储的三维是指：rowkey（行主键），column key(columnFamily+qualifier)，timestamp(时间戳)三部分组成的三维有序存储。

程序狗

2021/09/06

9720

面试，HBase如何设计rowkey

存储 hbase 编程算法 TDSQL MySQL 版

HBase中的rowkey是按字典顺序排序的，通过rowkey查询可以对千万级的数据实现毫秒级响应。然而，如果rowkey设计不合理的话经常会出现一个很普遍的问题----热点。当大量client的请求（读或者写）只指向集群的一个节点，或者很少量的几个节点时，也就代表产生了热点问题。

数据社

2020/11/24

1.1K0

Hbase 学习（七） rowkey设计

其他

一直以来对rowkey的设计都比较迷茫，《hbase权威指南》倒是给出了个还算靠谱的例子。下面这个例子有点儿像帖子表结构，它的rowkey设计是这样的，可以简单的理解为，什么人在什么时间发了什么信息，信息包括什么附件，它是用户为主线的一个设计。 <userId>-<date>-<messageId>-<attachmentId> 如果我们想查某个用户发的信息，我们可以设置scan的start rowkey 为该userId，end rowkey为userId+1即可。当我们要查某个用户某天发了

岑玉海

2018/03/01

8440

Hbase Rowkey设计及索引

https

开头，先功夫一个好消息，浪尖的微信公众号支持内容搜索了，入口请点击原文阅读。 https://data.newrank.cn/m/s.html?s=PSkwPS48MT87 也可以去菜单栏，点击进入入

Spark学习技巧

2018/12/14

6100

『设计模式』设计模式--策略模式

编程算法

今天去超市买东西，买了50多块钱的东西，然后收钱的时候他多收了，明明会员要打白金会员打9折，黄金会员95折，我是白金会员因该是9折。我问她：“你是不是不知道什么是策略模式” 她一脸茫然地看着我，“啊？先生请您再说一遍。” 我说：“我是白金会员，请选择白金会员的策略” 她说：“不好意思，您一年没来我们这里买过东西了，已经给您降档了！” 我说：“还有这操作？。。。。” 朋友觉得我为了几块钱这么墨迹，付完钱拉着我就走了，问我：“你说的什么模式怎么回事？” 我说超市收银系统就是很好的策略系统，就是一个典型策略模式。多收了2块5，心疼死我了，我慢慢给你讲！

风骨散人Chiam

2020/10/28

2.1K1

相似问题

Hbase模式设计

HBase模式设计

如何设计Hbase模式？

Hbase RowKey设计模式

如何设计HBase模式

活动推荐

体验智能媒资降冷，云点播优惠不要错过！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问如何从Pandas dataframe中删除一行中的“A”列等于另一行中的“B”列的行？
EN

云点播特惠1元起

回答 1

Stack Overflow用户

Hbase模式设计

HBase模式设计

如何设计Hbase模式？

Hbase RowKey设计模式

如何设计HBase模式

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从Pandas dataframe中删除一行中的“A”列等于另一行中的“B”列的行？EN

云点播特惠1元起

回答 1

Stack Overflow用户

Hbase模式设计

HBase模式设计

如何设计Hbase模式？

Hbase RowKey设计模式

如何设计HBase模式

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何从Pandas dataframe中删除一行中的“A”列等于另一行中的“B”列的行？
EN