从基于文件的列和行-pandas的最大值中删除重复项

文章/答案/技术大牛

发布

1回答

、、、

2b kl ilp kjh 2020 1df['E'] = pd.to_datetime(df['E'], unit='ms').d

浏览 35提问于2021-08-18得票数 1

回答已采纳

1回答

仅根据某些列选择唯一行

、

我有一个SQL视图，我希望只基于某些列获得唯一的行。如果所有其他列都相同(不包括A)，则必须删除重复项。如果所有其他列(B除外)相同，则必须删除重复项。我使用了下面的代码，但它仍然给出了A的最大值，然后给出了B的最大值，我想要得到不同的行，不包括这两列，我

浏览 2提问于2022-03-02得票数 0

3回答

根据列的最大值在Excel中有条件地去重

、、、

但是，我希望删除此数据集中的行，这样，最后，对于第二列中的每个唯一字，只保留列一中的值是该字的最大值的一行，甚至删除那些具有每个唯一字的最大值的重复的行，并为每个唯一字保留一行。: A-Z)，然后按列1排

浏览 2提问于2015-04-20得票数 2

回答已采纳

1回答

在Python中操作CSV文件

、、、

0] not in Names: Names.add(row[0]) 我正在使用Python2.7(Windows)使用此代码从CSV文件中删除重复项。我可以一次删除基于一个列的重复项。有没有什么方法可以同时从多个列中删除重复</

浏览 1提问于2015-11-17得票数 0

3回答

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

、、、

我有一个pandas dataframe，它根据两列(A和B)包含重复的值：1 2 12 7 13 4 8 我希望删除重复项，并将最大值行保留在列C中。

浏览 162提问于2015-08-19得票数 75

回答已采纳

1回答

Spark删除重复项并选择具有最大值的行

、、

我正在尝试删除基于column1的重复项，并选择column2中具有最大值的行。column2的值为"year"(2019,2020等)，类型为"String“。我的解决方案是，将第2列转换为整数，并选择最大值。 Dataset<Row> ds ; //The dataset with column1,

浏览 0提问于2020-11-18得票数 0

1回答

Pandas Dataframe丢弃记录及其副本

我希望删除基于列的pandas Dataframe中具有重复项及其重复项的记录

浏览 18提问于2019-11-14得票数 0

回答已采纳

2回答

在Unix中合并两个文件时，删除重复项并取其他记录的最大值

、

我有两个文件a.txt和b.txt，每个文件有6列。我想合并这两个文件，并删除基于所有6列的精确重复项，而对于其他情况，我希望基于第1列和第2列的分组，将第3列、第4列、第5列、第6列作为最大值。我想通过以下示例来解释这一

浏览 1提问于2020-07-14得票数 0

1回答

仅取R中数据框所有列的重复in的最大值

、、、

我有24525行22列的数据帧。最后一列是ID列，其他列是数字列。唯一ID数为18414，部分ID重复次数超过2次。我需要删除重复的ID，并且只保留另一个数据框中每个ID和每列的最大值。我尝试在for循环中对每一列进行排序，并删除重复项以

浏览 0提问于2021-01-13得票数 0

1回答

使用Pandas如何去复制以块形式读取的文件？

、、

我有一个大的固定宽度的文件被读成块10000行熊猫。除了从数据中删除重复项外，这对于所有东西都很有用，因为复制项显然可以在不同的块中。由于文件太大，无法全部装入内存，所以文件正在以块形式读取。我第一次尝试去复制文件的目的是只引入去重复文件所需的两列<

浏览 1提问于2015-06-04得票数 8

回答已采纳

1回答

excel只显示具有不同值的行。

、

我有一个带有集合字段集的“主”表(它是我每次提取的同一字段集)。C1 B 1 BA由于B:2已从2改为1，应导致： A B C1 B 2 BA 我想得到我的“主”表和数据的“下一次提取”之间的更改。挑战(我认为)是，我只希望在第三个工作表中显示有更改的行。

浏览 2提问于2016-06-30得票数 0

回答已采纳

1回答

如何基于多个动态列删除重复项

、、

使用bash(awk)，如何根据多列从管道分隔的文件中删除重复项，但需要将列作为输入参数传递。我在文件中有下面的数据Insert|val1a|val2|val3a|val4 我想要删除基于输入参数的重复项。有时，我希望使用位置1和位置3删除行</

浏览 0提问于2022-03-28得票数 0

回答已采纳

1回答

如何删除部分列上有重复值的行？

、

我正在创建将xlsx文件读取到pandas dataframe并向其添加新行的脚本。然而，我的问题是，我不想添加在前四列(总共包含5列)中具有相同值的重复项。第五个列值可以是任何值，但是基于这四列上的重复项，我想删除整行。除此之外，我的代码是全功能

浏览 26提问于2019-07-31得票数 0

回答已采纳

1回答

如何合并重复项并从其他列获取min/max值？

、、

我希望在一列中合并重复项，并从其他两列中获取最小/最大值:例如，从该文件中：100627109.00 100637104.0027612292.00 27626240.00 y27612669.00 27626569.00 y

浏览 4提问于2022-07-15得票数 -3

回答已采纳

2回答

如何使用带管道值的awk从管道分隔的文件中删除重复项？

、、

我正在尝试使用此如何基于多个动态列删除重复项从管道分隔的文件中删除基于多列的重复项，但是我发现在值中有一些管道在双引号中，如下所示3|XX|"2025035|6|15|0|0

浏览 0提问于2022-04-06得票数 1

回答已采纳

1回答

在特定列上添加来自其他数据帧的列，同时保留原始索引

、、、、

Pandas新手入门，并尝试基于两个数据帧共有的列从df2向df1添加列。我想保留df1中的索引。注意，df2有很多重复的行，包括重复的ItemIds。0 1 apple2 7 monster我想保留DataFrame 1的索引，并将Da

浏览 9提问于2019-07-09得票数 0

回答已采纳

1回答

excel:按3列检查重复行，保留一行

、

这可能是一个有点多的要求，但我想知道以下是否可能。这都是基于我在上的初始问题我有一个工作表，其中包含大约12列相同类型的数据被复制到其中，这意味着两行或更多行可能包含完全相同的数据，但是如果我可以检查重复，它将基于3个特定的列。我不想对此任务使用AutoFilter或条件格式，因为工作表可能包含数百到数千行，而我希望能够找到重复项，删除

浏览 0提问于2014-02-09得票数 2

回答已采纳

1回答

Python -为接近重复的行保留新列中的不同值，然后删除重复行

、、、

我有一个pandas dataframe，它是查询的结果，其中1列创建重复的行。我需要帮助通过名称识别重复项的非重复值，然后动态创建包含所有值的新列，然后删除重复项。下面的Mike在列"Code“中有重复项，Mark在"Lang”列中有<

浏览 0提问于2020-02-25得票数 1

1回答

有条件地删除重复的pandas* python*

、、、、

有没有办法有条件地在大约10列和400,000行的pandas数据框中删除重复项(特别是使用drop_duplicates )？也就是说，我希望所有有2列的行都满足一个条件:如果date (column)和store (column) #的组合是唯一的，则保留行，否则删除。

浏览 1提问于2015-05-03得票数 8

2回答

在pandas数据框中选择唯一的观测值

、

我有一个包含uniqueid列的pandas数据框。我想从基于此列的数据框中删除所有重复项，以便所有剩余的观测值都是唯一的。

浏览 0提问于2013-11-01得票数 7

回答已采纳

点击加载更多