使用Pandas检测重复的组_删除Pandas中的重复行(可能按组)_如何标记pandas数据帧中的重复组 - 腾讯云开发者社区

、、

说我的数据是： df = pandas.DataFrame([[[1,0]],[[0,0]],[[1,0]]]) 产生的结果： 0 0 [1, 0] 1 [0, 0] 2 [1, 0] 如果我编写以下内容，我希望删除重复项，并且只获取元素1,0和0,0： df.drop_duplicates() 我得到以下错误: TypeError: unhashable type：'list‘ 如何调用drop_duplicates()？更笼统地说： df = pandas.DataFrame([[[1,0],"a"],[[0,0],"b"],

浏览 0提问于2018-05-18得票数 14

回答已采纳

2回答

使用mqtt用户名与密码的方式连接腾讯云mqtt服务器问题？

、、、

为什么用mqtt用户名与密码的方法连接腾讯云mqtt服务器后，一段时间(几天)不连接后会自动断开？然后在使用相同的用户名与密码再次连接时就再也连接不上了。操作方法： 1. 使用了腾讯给的腾讯云物联网平台生成小工具自动生成用户名与密码 2. 使用MQTT.fx工具连接或者其他设备连接腾讯云mqtt服务器结果：使用原先同样的用户名与密码，在断开与腾讯云mqtt服务器一段时间(一般几天)后就再也无法使用相同的用户与密码连接到mqtt云服务器了

浏览 1472提问于2021-02-17

2回答

大熊猫drop_duplicates法DataFrame中重复指数的考虑

、、

Pandas的drop_duplicates方法考虑删除重复行时的所有列(默认)或列子集(可选)，并且不能考虑重复索引。我正在寻找一个干净的单行解决方案，在确定重复行时考虑索引和子集或所有列。例如，考虑一下DataFrame df = pd.DataFrame(index=['a', 'b', 'b', 'c'], data={'A': [0, 0, 0, 0], 'B': [1, 0, 0, 0]}) A B a 0 1 b 0 0 b 0 0 c 0 0 默认使用dro

浏览 1提问于2018-08-30得票数 6

回答已采纳

1回答

新人刚学小程序开发，求助~？

、

两个问题： 1、小程序的发布，只能通过腾讯云的生成环境吗？已有云服务器的情况下，还必须购买小程序开发工具的云服务器吗？ 2、自己学习实验的代码，通过了审核，在没有生成环境的情况居然就变成了线上版本，求大神解惑~！

浏览 250提问于2018-07-31

2回答

根据特定列删除重复行

如何在维护数据集的同时，根据特定列删除重复行。我试着用这些，我想要看到的是基于第3列到第6列的歧义。如果它们的值是相同的，那么处理过的数据集应该删除行，如示例所示：我使用了这个代码，但是我给了我一半的结果： Data <- unique(Data[, 3:6]) 假设我的数据集是这样的 A B C D E F G H I J K L M 1 2 2 1 5 4 12 A 3 5 6 2 1 1 2 2 1 5 4 12 A 2 35 36 22 21 1 22 32 31 5 34 12 A 3 5 6

浏览 5提问于2015-08-07得票数 1

回答已采纳

1回答

如何将列的重复值转置到新列上的特定位置？

、、

我正在尝试将列上的重复值转置为与第一个结果相同行上的新列创建数据集 import numpy as np import pandas as pd ref = ['a','a','b','c','c','c'] z = pd.DataFrame(ref) z = z.rename(columns={0:'name'}) 查找唯一值{名称，索引位置，n:重复} unique_values = {} i = 0 while i <= len(z)-1: for x

浏览 28提问于2021-09-28得票数 0

回答已采纳

1回答

Python选择和计数元素

、、、

我有一只熊猫数据，格式如下： import pandas as pd d1 = {'Product ID': ['A','B','C','D','A','D','E','A','B','C','B','C','E'], 'Buyer ID': [1,1,1,1,2,2,2,3,3,3,4,5,5]} df1 = pd.DataFrame(d1) 其格式如

浏览 3提问于2017-03-11得票数 2

回答已采纳

3回答

在R中保留NA的同时删除重复项

、

我有如下所示的数据： a<-data.frame(ID=c("A","B","C","C",NA,NA),score=c(1,2,3,3,5,6),stringsAsFactors=FALSE) print(a) ID score A 1 B 2 C 3 C 3 <NA> 5 <NA> 6 我尝试在不使用R的情况下删除重复项，将<NA>视为重复项，以获得以下结果： b<-data.frame(ID=c("A","B"

浏览 17提问于2018-01-26得票数 2

回答已采纳

1回答

使用组，只删除重复的NaNs。

、

使用我的数据按Assay、Image和Roi分组，对于每个组，我希望删除“强度”列中具有NaN值的所有行(第一行除外)。我的尝试可以删除重复项，但这并不是特定于NaN值的。 from pandas import Series, DataFrame import pandas as pd import numpy as np df = DataFrame({'assay':['cnt']*11, 'image':['001']*10+['002'],

浏览 1提问于2016-06-26得票数 0

回答已采纳

3回答

消除字典Python中的重复项

、、、、

我有一个用制表符分隔的csv文件：我只需要关注前两列并查找，例如，如果A-B对在文档中再次显示为B-A，如果B-A出现，则打印A-B。其余的配对也是如此。对于提出的示例，输出为：·A-B & C-D dic ={} import sys import os import pandas as pd import numpy as np import csv colnames = ['col1', 'col2', 'col3', 'col4', '

浏览 0提问于2018-03-06得票数 0

2回答

初次接触小程序，很多困惑，不知道怎么入门？

、、

1.小程序.云开发是否可以做出一套pc端管理系统来获取小程序数据访问量等信息？ 2.小程序.云开发官方提供的数据库和云存储空间是否可以扩展？ 3.小程序.云开发上传的图片可以上传到非腾讯云服务器吗

浏览 333提问于2018-10-10

1回答

为什么私有网络与基础网络主机关联后，基础网络主机仍然不可以访问私有网络内的云数据库？

、、、

1. 在私有网络基础网络互通中添加主机 2. 将MySQL实例挂到私有网络下的子网 3. 问题:无法从主机内访问MySQL服务,telnet 10.0.0.13 3306无法连通标题：私有网络与基础网络互通 - 私有网络 - 文档首页 - 腾讯云文档平台 - 腾讯云地址：https://cloud.tencent.com/document/product/215/2203

浏览 174提问于2018-03-15

1回答

R: data.table中setkey()之后重复更改的输出

、

在合并两个数据集的过程中，我使用函数duplicated检查数据是否重复。无论是在duplicated之前运行还是在setkey()之后运行，我都会得到两个不同的输出。这是data.table的自然行为吗？在我看来，通过设置键，复制的数量应该保持不变，据我理解，这只是对data.table的重新排序和索引。我错过了什么关键点吗？非常感谢！下面是一个示例data.table > DT id x1 x2 1: A 0 1 2: A 1 1 3: B 0 1 4: B 1 0 5: C 1 1 6: C 0 0 在这个未加键的数据集中运行dupli

浏览 1提问于2015-03-24得票数 1

回答已采纳

3回答

Pandas数据帧使用列逻辑对行进行重复数据消除

、、

我有一个大约有1亿行的熊猫数据帧。我对消除重复数据很感兴趣，但有一些标准我还找不到相关文档。我想要对数据帧进行重复数据消除，忽略其中一列会有所不同。如果该行是重复的，除了那一列之外，我只想保留具有特定字符串的行，比如X。示例数据帧： import pandas as pd df = pd.DataFrame(columns = ["A","B","C"], data = [[1,2,"00X"], [1,3,"010"]

浏览 27提问于2020-09-04得票数 2

回答已采纳

4回答

如何在DataFrame中查找重复的索引？

、、、

我有一个具有多级索引(“DataFrame”和" index ")的pandas索引。我希望找到所有非唯一的第一级(“实例”)索引值，并打印出这些值。我的框架看起来像这样： A instance index a 1 10 2 12 3 4 b 1 12 2 5 3 2 b 1

浏览 1提问于2015-01-19得票数 5

5回答

从数据帧中删除反向重复项

、、

我有一个包含两列的数据框，A和B。在这种情况下，A和B的顺序并不重要；例如，我认为(0,50)和(50,0)是重复的。在pandas中，从数据帧中删除这些重复项的有效方法是什么？ import pandas as pd # Initial data frame. data = pd.DataFrame({'A': [0, 10, 11, 21, 22, 35, 5, 50], 'B': [50, 22, 35, 5, 10, 11, 21, 0]}) data A B 0 0 50 1 10

浏览 63提问于2016-11-08得票数 14

回答已采纳

2回答

Pandas: drop_duplicates().fillna(0)不填零

、、、

我尝试从一个序列中删除重复项，然后用0填充NaNs。应该非常简单，但是当我将这两个函数链接在一起时，我仍然可以在期望0.0的地方获得NaN。 df = pd.DataFrame({'a':[1,1,2,3,3,4], 'b':[10,20,30,40,50,60]}) df['a'] = df['a'].drop_duplicates().fillna(0) 收益率： a b 0 1.0 10 1 NaN 20 2 2.0 30 3 3.0 40 4 NaN 50 5 4.0 60 鉴于： d

浏览 0提问于2018-01-20得票数 2

回答已采纳

3回答

使用R分隔不同数据格式中的重复行

假设我有一个dataframe df df = data.frame(A=c(1,2,1,4,1,2,5,4),B=c(2,3,4,6,2,3,6,6)) 如果我做了df[duplicated(df), ]，我得到的只是重复的行。但是我需要一个全球性的解决方案，它适用于每一个数据，并产生这样的结果： > dup1 A B 1 1 2 5 1 2 > dup2 A B 2 2 3 6 2 3 > dup3 A B 4 4 6 8 4 6 > others A B 3 1 4 7 5 6

浏览 4提问于2016-01-12得票数 1

回答已采纳

1回答

你如何只返回一组熊猫？

、

我有下面的脚本，我想要一个简单的组： # import the pandas module import pandas as pd from openpyxl import load_workbook writer = pd.ExcelWriter(r'D:\temp\test.xlsx', engine='openpyxl') # Create an example dataframe raw_data = {'Date': ['2016-05-13', '2016-05-13', '2016-05-1

浏览 1提问于2016-05-17得票数 1

回答已采纳

3回答

只有在重复数小于X时才删除重复

、

只有当重复的数量小于x(例如3)时，我才需要在我的DataFrame中删除重复的行(如果超过3个重复，保留它们!) 示例：其中count是重复的数目，重复的在data中。 data | count ------------- a | 1 b | 2 b | 2 c | 1 d | 3 d | 3 d | 3 预期结果： data | count ------------- a | 1 b | 1 c | 1 d | 3 d | 3 d | 3 我怎样才能做到这一点？提前谢谢。

浏览 2提问于2019-11-18得票数 1

回答已采纳