对pandas DataFrame中的重复项进行平均化，而不是使用drop_duplicates保留第一项

、、、

假设我有一个表单的Pandas DataFrame： id price dur2 153 130.00.09 158 105.0 0.0 10 158 155.0 0.0 我有一个名为id的列我希望通过保留unique id，然后执行id的price平均值来处理此i

浏览 30提问于2020-04-14得票数 0

1回答

熊猫:如何对数据中至少出现n次重复项目的数据进行筛选

、、、

我有一个包含重复条目的Pandas DataFrame；有些条目被列出了两次或三次。我想对它进行筛选，以便它只显示至少n倍列出的项。最终结果应该只列出每一项。

浏览 4提问于2015-10-03得票数 15

回答已采纳

3回答

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

、、、

我有一个pandas dataframe，它根据两列(A和B)包含重复的值：1 2 12 7 13 4 8 我希望删除重复项，并将最大值行保留在列C中。我是不是应该用drop_duplicates()或者别的什么？

浏览 162提问于2015-08-19得票数 75

回答已采纳

3回答

如何删除pandas数据框中列值重复的行？

、

Column31 dog 1 A我希望确定cat和bat是重复的相同值，因此希望删除一条记录并只保留第一条记录。得到的数据框应该只有。0 cat 1 C 1 dog 1 A

浏览 0提问于2018-06-16得票数 31

回答已采纳

4回答

熊猫把副本放在清单上

、、

说我的数据是：产生的结果：0 [1, 0]2 [1,0]df.drop_duplicates()df

浏览 0提问于2018-05-18得票数 14

回答已采纳

2回答

如何根据其他列中的一个条件和两个条件删除重复项？

、、、

我正在尝试根据Dataframe中的两列删除重复的"Box“行：import pandas as pd d = {'Box': ['A1', 'A1', 'A2', 'A3', 'A4',Ready', 'Prep', 'Ready'], 'Week':[11, 12, 12,

浏览 4提问于2019-06-03得票数 1

回答已采纳

3回答

Python(pandas)：基于两列删除重复项，将行与标志保留在另一列中

、

python pandas的新手，需要删除重复的索引行，并根据一列的标志在重复行中只保留一行，示例如下： Index value 1 value2 flag2 32 42 off3 33 43 off 根据index和flag cloumn进行过滤后value 1 value2 fla

浏览 70提问于2019-05-18得票数 0

3回答

熊猫不移除重复

、

在以下脚本中 df_dict = {"A": [1,2,3,3,4], "B": [1,2,2,3,4]} start() d

浏览 5提问于2020-08-03得票数 2

回答已采纳

1回答

巨蟒大熊猫如何有选择地丢弃复制

、、

我需要查看列'b‘中的所有行，如果该行不是空的，则转到另一个相应的列'c’，并对第三列'c‘中的所有其他行删除此特定索引的重复项，同时保留该特定索引。我遇到了drop_duplicates，但是我无法找到只查找突出显示的行的副本的方法，而不是一列

浏览 6提问于2016-09-22得票数 1

回答已采纳

1回答

如何在pandas中读取和取多个表文件的平均值？

、

这就是两个表的样子我知道我可以读懂它们，并可以使用以下命令取它们的平均值names=['wave','num',

浏览 0提问于2018-08-01得票数 1

1回答

Dask Dataframe:按A列删除重复项，保留B列中值最高的行

、、

基本上，这是对熊猫在的答案。在熊猫里，我采用了这个解决方案但我无法有效地将相同的解决方案应用于df.loc[max_idx.compute()] 在整个dask框架上，方法df.nlargest(1, "B")可以满足我的需要，但我还没有想出如何使用groupby来满足我的</e

浏览 1提问于2021-06-17得票数 0

回答已采纳

3回答

我有一个有100行的大型数据帧，结构是qtr_dates<datetime.date>，sales<float>，还有一个结构相同的小数据帧，少于100行。我想合并这两个df，这样合并的df将拥有来自小df的所有行，而其余的行将从大df中获取。现在我正在做这个 df = big_df.merge(small_df, on=big_df.columns.tolist(), how='outer') 但这是在创建具有重复qtr_d

浏览 18提问于2021-10-07得票数 0

回答已采纳

3回答

Pandas/Python:如何在不重复的情况下连接两个数据帧？

、、

我想将两个数据帧A，B连接到一个没有重复行的新数据帧中(如果B中的行已经存在于A中，则不添加)： I II I II 0 1 2 5

浏览 1提问于2014-01-24得票数 81

回答已采纳

1回答

熊猫如何找到一对一的相关值？

、

我有I对的df，并且我尝试过滤那些具有唯一一对一关系的对，以便没有left_id值具有来自right_id的多个对应值，同时，没有right_id值具有来自left_id的多个对应值。让我们生成一些示例数据用于说明： np.random.seed(0) df = pd.DataFrame(data = np.random.randint(0,1000,(1000000,2)),right_id']) 就像这样： left_id right

浏览 5提问于2020-01-05得票数 0

回答已采纳

1回答

数组:将稀疏数组合并为一个人口更密集的数组。

、

我有下面的表格，它是稀疏的，但也有重复的列。| A | || A | X |使用df[["LX ID", "ISIN"]].drop_duplicates()生成下面的内容，去掉相同的行，但在列中仍然存在重复(例如，最后3列)： +--------

浏览 0提问于2017-02-03得票数 1

回答已采纳

2回答

Python合并两个csv文件python

、

应该将file2.csv与文件file1.csv合并，如果有一些更改要替换为file1.csv中的数据，以保存file2.csv中的数据 Frame_Nr; Data110 0 0 0 12 1 1 1 我的代码

浏览 1提问于2019-11-22得票数 1

回答已采纳

1回答

dataset.drop_duplicates()给出ValueError:传递的项数错误，但示例(frac=1)没有

、

我有一个名为work3的数据集，我试图根据'clean_name‘列删除重复的行。下面是关于work3的信息：输出：Int64Index: 3295520 entries, 0clean_name'])ValueError: Wrong number of items passed 2117463, placement i

浏览 1提问于2017-10-13得票数 1

回答已采纳

2回答

删除大熊猫中的所有行，在一列中有相同的值，在另一列中有不同的值。

、

假设我有以下类型的dataframe：0 123 a2 123 a4 345 a6 456 d8 678 e对于col1中的特定重复值，所有对应的col2值都应该完全相同。如果对应的col2值中有一个不同，则删除该col1值的所有实例。因此，在

浏览 0提问于2019-05-14得票数 2

回答已采纳

1回答

dask df.col.unique() vs df.col.drop_duplicates()

在“达斯克”中，和两者都返回一个包含df.col的唯一元素的系列。索引存在差异，unique结果被索引为1.N，而drop_duplicates则由任意看上去的数字序列索引。 drop_duplicates返回的索引的意义是什么？如果索引不重要，是否有理由使用其中一种而另一种？

浏览 4提问于2016-03-07得票数 8

回答已采纳

1回答

drop_duplicates - TypeError:在*后面键入对象参数必须是序列，而不是映射

、、

我已更新我的问题，以提供一个更清楚的例子。是否可以使用Pandas中的drop_duplicates方法根据列id删除重复行，其中的值包含一个列表。考虑一下“三”列，它由列表中的两项组成。是否有一种方法可以删除重复的行，而不是迭代执行(这是我当前的解决办法)。我列举了以下例子，概述了我<em

浏览 3提问于2016-06-13得票数 14

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

熊猫:如何对数据中至少出现n次重复项目的数据进行筛选

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

如何删除pandas数据框中列值重复的行？

熊猫把副本放在清单上

如何根据其他列中的一个条件和两个条件删除重复项？

Python(pandas)：基于两列删除重复项，将行与标志保留在另一列中

熊猫不移除重复

巨蟒大熊猫如何有选择地丢弃复制

如何在pandas中读取和取多个表文件的平均值？

Dask Dataframe:按A列删除重复项，保留B列中值最高的行

如何合并大数据帧和小数据帧？

Pandas/Python:如何在不重复的情况下连接两个数据帧？

熊猫如何找到一对一的相关值？

数组:将稀疏数组合并为一个人口更密集的数组。

Python合并两个csv文件python

dataset.drop_duplicates()给出ValueError:传递的项数错误，但示例(frac=1)没有

删除大熊猫中的所有行，在一列中有相同的值，在另一列中有不同的值。

dask df.col.unique() vs df.col.drop_duplicates()

drop_duplicates - TypeError:在*后面键入对象参数必须是序列，而不是映射

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐