根据行中的值是否重新出现在dataframe中，在pandas dataframe中创建新列

在pandas dataframe中，可以使用duplicated()函数来判断行中的值是否重新出现在dataframe中，并根据结果创建新列。

具体步骤如下：

导入pandas库：import pandas as pd
创建一个示例的dataframe：

data = {'A': [1, 2, 3, 4, 5],
        'B': [1, 2, 3, 4, 5]}
df = pd.DataFrame(data)

使用duplicated()函数判断行中的值是否重新出现，并创建新列：

df['IsDuplicated'] = df.duplicated()

这样，新的列IsDuplicated将会被添加到dataframe中，其中值为True表示该行的值在dataframe中已经出现过，值为False表示该行的值在dataframe中是首次出现。

示例结果如下：

   A  B  IsDuplicated
0  1  1         False
1  2  2         False
2  3  3         False
3  4  4         False
4  5  5         False

这个功能在数据清洗和数据分析中非常有用，可以帮助我们识别和处理重复的数据。

在pandas DataFrame - python中返回带有公共列值的条目

python、pandas、dataframe

我在python pandas中有一个DataFrame，它包含几个不同的条目(行)，这些条目(行)在列中也具有整数值，例如： A B C D E F G H 0 1 2 1 0 1 2 1 2 1 0 1 1 1 1 2 1 2 2 1 2 1 2 1 2 1 3 3 0 1 1 1 1 2 1 2 4 2 2 1 2 1 2 1 3 我将只返回列中包含常用值的行，结果应该是： A B C D E F G H 1 0 1 1 1 1 2 1 2 3

浏览 2提问于2017-05-02得票数 1

2回答

python:分离出panda dataframe中有重复项的行

python、dataframe、duplicates

假设数据帧df具有三列c1, c2, c3。 df=pd.DataFrame() df['c1']=[1,2,3,3,4] df['c2']=["a1","a2","a2","a2","a1"] df['c3']=[1,2,3,3,5] print df df1=df[df.duplicated()] print df1 df1只有一行，即 c1 c2 c3 3 3 a2 3 但是我想要 c1 c2 c3 2 3 a2 3

浏览 0提问于2016-05-11得票数 2

2回答

基于多行修改python中的熊猫数据

python、python-3.x、pandas

我正在使用Pandas / Python中的DataFrame，每一行都有一个ID (这不是唯一的)，我想修改dataframe，为每一行添加一个具有多个匹配ID的列。 Starting with: ID Name Rate 0 1 A 65.5 1 2 B 67.3 2 2 C 78.8 3 3 D 65.0 4 4 E 45.3 5 5 F 52.0 6 5 G 66.0 7 6 H 34.0 8 7 I 2.0 Trying to get to: ID Nam

浏览 5提问于2016-02-13得票数 3

回答已采纳

4回答

我们如何检测pandas数据帧中的不一致性？

python、pandas

我有以下数据帧，我想检测其结果是否不一致： >>> import pandas as pd >>> import numpy as np >>> df = pd.DataFrame(np.array([[1, 2, 3, 1], [4, 5, 6, 0], [7, 8, 9, 0], [4, 5, 6, 1], [1, 2, 3, 1]]), ... columns=['a', 'b', 'c', 'result']) >>&g

浏览 0提问于2020-05-20得票数 2

2回答

如何根据另一列中的值筛选数据帧中的重复列

python、pandas、dataframe、filter、duplicates

当列“DataFrame”= 10时，我想根据列"NID“、"Lact”和代码过滤重复的行。下面的数据提供了示例数据 data_list = {'NID': {1: '1', 2: '1', 3: '1', 4: '1', 5: '2', 6: '2', 7: '1'}, 'Lact': {1: 1, 2: 1, 3: 1, 4: 2, 5: 2, 6: 2, 7: 1}, 'Code': {

浏览 15提问于2022-02-24得票数 0

回答已采纳

2回答

在Pandas中只保留跨多个列的唯一重复行

python、pandas

考虑dataFrame，如下所示： >>> df brand style rating 0 Yum Yum cup 4.0 1 Yum Yum cup 4.0 2 Nissin cup 3.5 3 Indomie pack 15.0 4 Indomie pack 5.0 很容易根据列保持副本：品牌和style，使用： df = df[df.duplicated(['brand', 'style'], keep=False

浏览 3提问于2021-06-27得票数 1

1回答

Pandas -如何将重复方法的结果存储为新列中的布尔值？

python、pandas

我有一个pandas dataframe，我想向其中添加一列，并根据特定列值复制返回的duplicated()方法为新列赋值。这是我现在拥有的代码： df['duplicated'] = df.duplicated(subset='specific_column', keep=False) 上面一行的结果显示为True或False。然而，我的新的“重复”列值的实际类型既不是布尔值，也不是字符串，而是“method”类型。因此，我的问题是如何将结果存储为布尔值True或False，以便以后在进一步的检查中使用这些结果。我假设也应该有一种方法将它们存储为str。 *

浏览 0提问于2016-03-16得票数 3

3回答

使用Pandas进行聚合和分组

python、pandas、dataframe、grouping、aggregation

我正在尝试根据帐号添加一列值，并将结果显示在新列中。另外，我将合同帐户的第一个实例标识为唯一值，将其他实例标识为重复实例。例如： Index CA# Duplicate? $ $$ 1 1101 True 440.4 880.80 2 1101 False 440.4 - 3 1102 True 440.8 440.80 4 1103 True 441.2 441.20 5 1106 True 442.4 1,3

浏览 8提问于2019-05-27得票数 0

回答已采纳

2回答

在Excel中找到重复行并添加到字典中？

python、python-3.x、pandas

我有一张纸，两栏 xCode xYear Repeated 1. 100 1900 3 2. 100 1900 3 3. 100 1934 3 4. 200 1921 1 5. 157 1945 1 如何在'A‘列中找到重复行？在字典中添加此行(Key = 'A‘值& value = 'B’值) import pandas as pd data = pd.read_excel (r'./1.xlsx') df = pd.DataFrame

浏览 7提问于2022-01-02得票数 0

回答已采纳

3回答

基于列子集的数据过滤

python、pandas

以下是数据文件 import pandas as pd df = pd.DataFrame({'A' : [1, 1, 2, 2, 3, 4, 5], 'B' : [11, 11, 12, 12, 13,14,15], 'C' :[0.12232, 0.12232, 0.3455, 0.3455, 0.112, 0.567, 0.8901], 'D' :[False, True, True, True, True, T

浏览 4提问于2019-12-22得票数 0

回答已采纳

1回答

如何识别pandas中的重复条目

pandas

我有一个如下的数据框架。 title description 0 mmm mmm 1 mmm mmm 2 mmm mmm 3 mmm mmm 4 mmm mmm 5 mmm mmm 6 mmm mmm 7 nnn nnn 8 nnn nnn 9 lll lll 10 jjj jjj 我希望保留一个条目并删除所有其他重复条目，同时返回另一个数据帧，其中包含上述数据帧中已删除条目的详细信息。例如，输出应该是； title description 0 mmm mmm 1 nnn nnn 2 lll lll 3

浏览 11提问于2019-07-17得票数 0

回答已采纳

3回答

如何检查一列的每个值是否映射到另一列中的一个值？

python、pandas、performance、dataframe

我有这样的数据 import pandas as pd df = pd.DataFrame({'A':list('bbcddee'), 'B': list('klmnnoi')}) A B 0 b k 1 b l 2 c m 3 d n 4 d n 5 e o 6 e i 我想用A和B列创建一个字典。 dict(zip(df.A, df.B)) 在此之前，我想检查A中的每个值是否仅映射到B中的一个值；如果没有，则应该抛出一个错误；上面不是这样的，因为b映射到k，l和e被映射到o和i。处理这

浏览 2提问于2020-07-05得票数 3

回答已采纳

1回答

熊猫-根据环境等级来选择行

python、pandas

我有一个数据框架，在这里，我希望获得“第一个可用的”索引，该索引基于数据帧的某些列中的一个嵌套的值层次结构。示例： import pandas as pd foo = ['a','a','a','a','b','b','b','b'] bar = [0,0,1,1,2,2,1,1] foobar = ['x',1,1,2,2,3,4,5] df = pd.DataFrame({'foo':foo,'bar':bar

浏览 4提问于2021-01-05得票数 0

回答已采纳

1回答

Python:删除多个条件的空值和重复项

python、pandas

我对python还很陌生，经过大量的研究和测试，我仍然无法解决这个问题。我试图在某些条件下删除空号和副本，本质上我应该保留唯一的“ID”。我能够使用.duplicated，然后是.drop_duplicates和.dropna来删除数据数据的一个子集的相关行，但是我无法在不删除想要保留的行的情况下，将所有数据放在原始数据want上。我也想把所有掉下来的记录保存在一个单独的数据中，但我还没有意识到这是多么的可能。条件；只有在“ID”和“type”被重复时，“”删除所有重复项(keep=False)，并且“类型”是唯一的，只有当“ID”和“类型”是重复的“ID”和“类型”时，“”才会删除空

浏览 1提问于2020-12-04得票数 0

回答已采纳

2回答

寻找副本并创建一个列来指出大熊猫中的重复

python-3.x、pandas

| Col1 | Col2 | Col3 | |------|------|------| | m | n | o | | m | q | e | | a | b | r | 假设我有一个pandas DataFrame，如上面所示。注意，col1值对于0th和1st行是相同的。是否有方法仅基于duplicate entries查找数据文件上的所有Col1。此外，我还想添加另一列，比如is_duplicate，它将对我的DataFrame和False的所有重复实例使用True。注意:我只想根据Col1中的值找到副本，其

浏览 10提问于2020-07-24得票数 0

回答已采纳

2回答

删除非重复项

python、pandas

一只熊猫有两栏。要求删除第一列中的条目没有重复项的行。示例数据： 1个A 1 B 2 A 3维 2 C 4英 4英预期产出 1个A 1 B 2 A 2 C 4英 4英换句话说，它需要从第一列中删除所有出现的(隐含唯一的)值。在python (~50k行)中实现这一目标的最快方法是什么？

浏览 2提问于2015-10-17得票数 8

回答已采纳

1回答

在dataframe中放置列中的行，其列有超过一定数量的不同值。

python、pandas、dataframe

我有一个示例dataframe，如下所示，并试图删除列cluster_num只有一个不同值的行。 df = pd.DataFrame([[1,2,3,4,5],[1,3,4,2,5],[1,3,7,9,10],[2,6,2,7,9],[2,2,4,7,0],[3,1,9,2,7],[4,9,5,1,2],[5,8,4,2,1],[5,0,7,1,2],[6,9,2,5,7]]) df.rename(columns = {0:"cluster_num",1:"value_1",2:"value_2",3:"value_3",4:&#

浏览 4提问于2021-03-24得票数 1

回答已采纳

1回答

熊猫-具有多指标的csv数据

pandas、dataframe

我有一个具有多个索引的随机数据，如： import numpy as np from itertools import product import pandas as pd c1 = np.arange(3,5,1) c2 = np.arange(7,9,1) c3 = np.arange(0,135,45) df= pd.DataFrame(list(product(c1, c2, c3)), columns=['c1', 'c2','c3']) df['c4'] = df.index df = df.set_ind

浏览 3提问于2022-06-14得票数 1

回答已采纳

3回答

检查列的值是否首次出现在组中

python、pandas、numpy、pandas-groupby

我希望向DataFrame中添加一个新的布尔列，该列指示在groupby组中是否首次看到给定列的值。我的DataFrame是这样的 UserID Value 0 1955 30 1 1955 40 2 1955 30 3 1956 30 4 1957 30 5 1957 50 6 1958 30 7 1958 50 8 1958 30 9 1958 30 我想得到这一点： UserID Value IsNewVa

浏览 4提问于2021-05-16得票数 1

回答已采纳

1回答

Pandas中基于多规则的重复数据删除

python、pandas

我想根据多个条件对pandas中的行进行去重。我有3列: name、id和nick_name。第一条规则是寻找重复的id，当id匹配时，只要我至少保留一行，就只保留name和nick_name不同的行。换句话说，如果name和nick_name不匹配，则保留该行。如果name和nick_name匹配，则删除该行，只要该行不是为该id留下的唯一行。示例数据： data = {"name": ["Sam", "Sam", "Joseph", "Joseph", "Joseph", "Ph

浏览 23提问于2021-02-19得票数 2

回答已采纳

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

根据行中的值是否重新出现在dataframe中，在pandas dataframe中创建新列

相关·内容

在pandas DataFrame - python中返回带有公共列值的条目

python:分离出panda dataframe中有重复项的行

基于多行修改python中的熊猫数据

我们如何检测pandas数据帧中的不一致性？

如何根据另一列中的值筛选数据帧中的重复列

在Pandas中只保留跨多个列的唯一重复行

Pandas -如何将重复方法的结果存储为新列中的布尔值？

使用Pandas进行聚合和分组

在Excel中找到重复行并添加到字典中？

基于列子集的数据过滤

如何识别pandas中的重复条目

如何检查一列的每个值是否映射到另一列中的一个值？

熊猫-根据环境等级来选择行

Python:删除多个条件的空值和重复项

寻找副本并创建一个列来指出大熊猫中的重复

删除非重复项

在dataframe中放置列中的行，其列有超过一定数量的不同值。

熊猫-具有多指标的csv数据

检查列的值是否首次出现在组中

Pandas中基于多规则的重复数据删除

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐