如何使用python识别重复的值并创建不同的列

使用Python识别重复的值并创建不同的列可以通过以下步骤实现：

导入所需的库：

import pandas as pd

创建一个包含重复值的数据集：

data = {'ID': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
        'Value': ['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A']}
df = pd.DataFrame(data)

使用duplicated()函数识别重复的值，并将结果保存在一个新列中：

df['Is_Duplicate'] = df.duplicated('Value')

使用cumsum()函数创建一个新列，用于标识不同的重复值：

df['Duplicate_Group'] = df['Is_Duplicate'].cumsum()

完整的代码如下：

import pandas as pd

data = {'ID': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10],
        'Value': ['A', 'B', 'C', 'A', 'B', 'C', 'A', 'B', 'C', 'A']}
df = pd.DataFrame(data)

df['Is_Duplicate'] = df.duplicated('Value')
df['Duplicate_Group'] = df['Is_Duplicate'].cumsum()

print(df)

这段代码将输出以下结果：

   ID Value  Is_Duplicate  Duplicate_Group
0   1     A         False                0
1   2     B         False                0
2   3     C         False                0
3   4     A          True                1
4   5     B          True                2
5   6     C          True                3
6   7     A          True                4
7   8     B          True                5
8   9     C          True                6
9  10     A          True                7

在这个例子中，我们使用了Pandas库来处理数据。首先，我们创建了一个包含重复值的数据集。然后，我们使用duplicated()函数识别重复的值，并将结果保存在一个新列中。接下来，我们使用cumsum()函数创建一个新列，用于标识不同的重复值。最后，我们打印出结果。

这个方法可以用于识别和处理数据集中的重复值，以便进一步分析和处理。

如何使用python识别重复的值并创建不同的列

、、

我有这种类型的数据，我不知道如何识别和创建不同的列方向W WNW WNW NW WNW SW WSW S SE SSW S SSW WSW WSW SSW WSW WSW SSE SE SE 例如，SE的重复次数超过我想用p

浏览 4提问于2020-05-06得票数 0

1回答

搜索具有相同名称(在同一数据集中)的列，并创建一个新列，该列采用填充的第一个值

、、

| Joe | Nan | Nan | China |我的问题是，如何创建新的编号、名称、国家/地区列(等)这只是找到like列，然后查看填充了哪一列，并提取该值。注在本例中，我只有两个重复的列，但理想情况下，我希望能够处理许多不同的

浏览 0提问于2021-12-01得票数 0

5回答

基于条件R的行匹配和删除

、、、、

我给你们准备了一个有趣的。54986 987 67871 9 9837

浏览 3提问于2018-09-07得票数 2

回答已采纳

1回答

Python -为接近重复的行保留新列中的不同值，然后删除重复行

、、、

我有一个pandas dataframe，它是查询的结果，其中1列创建重复的行。我需要帮助通过名称识别重复项的非重复值，然后动态创建包含所有值的新列，然后删除重复项。下面的Mike在列"Code“中有重复项，Mark在"Lang”列中有重复</em

浏览 0提问于2020-02-25得票数 1

1回答

SQL:如何从上到下依次扫描整个表

如何“扫描”从顶部/开始到底部/末尾的SQL表(大约120 k行/50列)，对于找到的每一行，我都需要‘做些什么’。 “做某事”部分是搜索相同的same，以查看是否有多个列存在，并报告是否存在列。我试图识别重复行，其中的“重复-ness”(!)是基于两列，但这两列没有索引。我没有任何代码示例可供提供，因为我仍处于概念阶段，但各种<em

浏览 0提问于2015-01-19得票数 -2

1回答

从django模型中的postgresql获取不同的列

、、、

我有一个postgresql表，其中包含重复数据的列，这些数据是使用django模型创建的：为了获得列的不同值，我们使用postgre命令，如下所示：但是我希望使用python作为数组来获取这些数据。如何从py

浏览 1提问于2014-04-08得票数 0

回答已采纳

1回答

如何在python中将不同的数值重复到数据中(类似于R中的rep() )

、、

我想在python中使用重复不同数量(1599和4898)的两个值(红色和黄色)来生成数据。列应该先有红色1599次，然后是黄色4898次。在R中，它看起来像是：如何在python中创建相同的列？

浏览 6提问于2022-03-15得票数 0

回答已采纳

1回答

如何识别和标记特定列中重复的数据

、、

我有一个数据集，在不同的列中包含一些重复的I和日期。我正在尝试识别和标记重复的ID，这样我就可以使用ifelse语句来进一步分解这个数据集。如果您查看数据，您将看到在Case: Case Number列中有一个重复的ID。在Questionnaire: Created Date列中，日期是不同的。基本上，我希望能够识别<

浏览 5提问于2021-12-14得票数 0

回答已采纳

3回答

为重复的父文档创建便笺视图

、、

我们有一个Xpages应用程序，最近发现了一个问题，其中有几个Notes文档有重复项，但重复项也是父文档，而不是响应文档。是否可以创建一个Notes视图来显示副本，其中所有副本都是父副本？我知道显示冲突的公式如下，但是如果他们都是父母呢？ SELECT @IsAvailable($Conflict)

浏览 1提问于2015-10-01得票数 0

3回答

Textmate:从更大的列表中删除电子邮件地址列表

、、、、

这感觉应该是非常简单的事情，但我一直无法找到任何方法来完成它。我想知道：是否有办法从主列表中删除这个地址列表，而不对每个100+地址单独执行查找/替换？

浏览 6提问于2017-06-05得票数 1

回答已采纳

1回答

如何使用python找出两个语音文件的差异

、、、、

我想要两个比较两个语音文件，并找出他们之间的差异。假设我有一个音乐轨道原始文件和另一个我从音乐中读出的文件，我想让两个文件比较这两个文件并找出它们的音素之间的差异。实际上，单词对我来说并不重要，重要的是音素之间的相似度，我想找出类似于相似度百分比的值。我更喜欢用Python实现一些东西。

浏览 5提问于2013-07-07得票数 7

2回答

R-检查dataframe列中的值是否唯一。

、

我正在我的dataframe中创建一个新列(标志)，它根据另一列(数字)识别唯一或重复的数字。我尝试使用重复的函数，但这只将重复的值标识为重复的值，并将原来的事件保留为不重复(如下面的编号100001所示)：100000 unique 10

浏览 5提问于2022-10-02得票数 1

2回答

如何使用Python和Pandas将多个具有相似和不同列的CSV文件合并为1个文件？

、、、、

，并充当一个惟一的标识列或主键，它不应在最终的CSV文件中重复。列中也可能有一些行，这些行并不为许多CSV文件中的每一条SendID记录携带一个值。因此，基于唯一SendID的一行可以具有用于列K而不是列Q的值。在这种情况下，对于该记录，列Q的值将为NULL或空。如何使用<

浏览 61提问于2021-01-20得票数 0

回答已采纳

1回答

删除Pandas中的列

、、

我使用一个大型Python，并注意到有些列对于每一行都有相同的值，但是列的名称不同。另外，一些值是文本或timeseries数据。非常感谢

浏览 1提问于2020-07-13得票数 0

1回答

excel一列有很多重复的单词，另一列有值(数字)，需要用公式对每个单词的所有值求和

、

一列包含美国州(许多重复)，另一列包含值(数字)，并且需要使用formula对每个州的所有值求和，我如何创建一个公式来识别单词何时相同，而不告诉公式中的单词。

浏览 1提问于2017-02-28得票数 0

2回答

使用jQuery查找和标记HTML中的重复项

、、

我有一个动态生成的表。它不仅改变了纯粹的内容，而且在不同的情况下也有不同的列名。但是，所有可能出现的表之间有一个共同点--1、两个或全部三个列名现在，我想检查这些列的副本。然而，有一条链，我想试着去遵循，清楚地证明： “检查列名、姓、名中的所有值。如果该列中有一两条不存在，则可以忽略它，并

浏览 7提问于2015-06-22得票数 1

2回答

是否有可排序和可搜索的Python数据结构？

、、、

我使用python来管理要处理的字符串队列。它有几个要求：如果没有本土化的结构，我会考虑维护两种结构。将维护字符串及其优先级的一个，

浏览 2提问于2011-05-25得票数 3

回答已采纳

1回答

查找重复DisplayOrder并分配唯一DisplayOrder的T脚本

、、

我有一张有下列列的表格。1 1 1 3 2现在，由于某种原因，我的DisplayOrder我希望运行这个脚本，该脚本将查找重复的DisplayOrder记录，并使用下一个唯一值对它们进行更改。我不能设置具有唯一约束的DisplayOrder字段，因为对于不同的<

浏览 5提问于2014-08-20得票数 0

回答已采纳

1回答

条件格式excel:标识整组数据的单行(仅行)内的重复值单元格并对其着色

、、、

我正试图弄清楚如何有条件地格式化(或在必要时创建宏)一行，以标识该行列中具有重复值的单元格(并高亮显示这些黄色)，然后使用整个数据集(100+行)的格式绘制器拖动，以便识别所有特定行的复制项(不接受不同行中的重复单元格值我已经手动完成了下面所附的示例。如果有更好的办法，请告诉我。重复

浏览 0提问于2018-08-24得票数 1

回答已采纳

2回答

识别python中具有不同列名的重复列值的列

、、、、

如何识别具有相同column_value但具有不同列名的数据帧中的列，我们需要列出这两个列，这里我只能列出其中一个列。pd.DataFrame(raw_data, columns = ['id', 'name','age','name_dup','age_dup']) 就像在图像中一样，可以看到name和name_dup有相同的<

浏览 7提问于2019-12-16得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用python识别重复的值并创建不同的列

相关·内容

如何使用python识别重复的值并创建不同的列

搜索具有相同名称(在同一数据集中)的列，并创建一个新列，该列采用填充的第一个值

基于条件R的行匹配和删除

Python -为接近重复的行保留新列中的不同值，然后删除重复行

SQL:如何从上到下依次扫描整个表

从django模型中的postgresql获取不同的列

如何在python中将不同的数值重复到数据中(类似于R中的rep() )

如何识别和标记特定列中重复的数据

为重复的父文档创建便笺视图

Textmate:从更大的列表中删除电子邮件地址列表

如何使用python找出两个语音文件的差异

R-检查dataframe列中的值是否唯一。

如何使用Python和Pandas将多个具有相似和不同列的CSV文件合并为1个文件？

删除Pandas中的列

excel一列有很多重复的单词，另一列有值(数字)，需要用公式对每个单词的所有值求和

使用jQuery查找和标记HTML中的重复项

是否有可排序和可搜索的Python数据结构？

查找重复DisplayOrder并分配唯一DisplayOrder的T脚本

条件格式excel:标识整组数据的单行(仅行)内的重复值单元格并对其着色

识别python中具有不同列名的重复列值的列

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐