从DataFrame中删除NaNs并从多索引中删除重复项

文章/答案/技术大牛

发布

4回答

、

给定多索引DataFrame： col_A col_BA x 1.0NaN x NaN 2.0 y 2.0 NaN 如何从df中删除can并从多索引中<

浏览 16提问于2017-08-19得票数 2

回答已采纳

1回答

如何真正过滤熊猫数据集而不离开各地的Nans

、、

假设我有一个巨大的DataFrame，它只包含少数几个与我执行的过滤匹配的单元格。如何才能在一个新的dataframe中只获得与其匹配的值(以及它们的索引和列)，而不使用整个其他的DataFrame，而后者变成了Nan。使用dropna删除Nans只会删除整个列或行，而filter用Nans替换非匹配项。这是我的密码：import pandas as pd df = pd.<

浏览 2提问于2020-12-18得票数 1

回答已采纳

2回答

如何在熊猫数据栏中放置“nan”行？

、、、

我有一个dataframe (表示为'df')，在列中缺少一些值(表示为'col1')。我应用了一个set函数来查找列中的唯一值：{0.0, 1.0, 2.0, 3.0, nan, nan, nan, nan, nan, nan, nan, nan, nan, nan} 我正在尝试将这些'nan‘行从我尝试过的dataframe中删除：

浏览 8提问于2022-06-10得票数 0

回答已采纳

1回答

如何删除第一级索引，然后将剩余的索引值与pd DataFrame的自定义逻辑合并？

、、、、

假设我有一个像这样的MultiIndex DataFrame：year product city C NY 9 3我想做一个有点复杂的合并，其中DataFrame索引(年份)的第一级被删除，DataFrame中现在的第一级<em

浏览 0提问于2018-12-28得票数 1

回答已采纳

1回答

dask dataframe删除重复索引值

、、、、

我使用的是python2.7中的dataframe，并且希望从我的df中删除重复的索引值。当我用熊猫的时候而且起作用了我可以重置索引，而不是使用作为索引的列来删除复制的，但

浏览 0提问于2017-11-28得票数 1

回答已采纳

3回答

在dataframe中找到副本，并且只保留最高的副本。

、、、、

我试图为每个较高的组在dataframe中找到重复项，以便稍后可以根据索引从另一个dataframe中删除这些副本，这样主dataframe就没有重复，只有最低值。5 2 407 7 1 200我需要的是只在每组具有最高值的连续重复中保留重复

浏览 8提问于2021-11-10得票数 0

回答已采纳

2回答

在groupby子句中，错误的含义是什么不能处理非唯一的多个索引？

、、、、

我有一个数据，它有三个级别的索引，我希望计算一个值偏离平均值有多大。但根据我的指数，对于不同的群体，我有不同的平均值。not_indexed_same=not_indexed_same) 2524 # possible that Series -> DataFrame by applied function 4 5

浏览 2提问于2016-03-17得票数 8

2回答

是否有MySQL命令删除除主索引外的所有索引？

、、

我有一个在页面加载上运行的脚本，它将条目添加到MySQL数据库表中，并从数据库表中删除重复项。下面是删除重复项的脚本部分： mysql_query("

浏览 0提问于2012-04-17得票数 4

1回答

returns = df.pct_change(1) * 100 returns是以日期作为索引的dataframe，我想用dataframe的最后一列(即^BSESN)分别回归每一列。因为有700多列，所以我想遍历这些列。我还想存储每次回归后的残差。我使用了以下代码的不同版本，但我总是收到相同的错误。我需要在每个单独的回归过程中删除具有NaN值的行(而不是删除具有任何具有NaN值的列的行)。BSESN']).fit() residuals[column]

浏览 18提问于2020-07-11得票数 2

回答已采纳

1回答

返回列表中具有索引的DataFrame的行

、

我有一个索引值列表和一个DataFrame。我要查找其索引出现在列表中的所有行。如果我这样做了然后，只要列表中有一个匹配项，我就会返回与sample中的元素一样多的行，否则返回一个KeyError。但大多数行都充满了NaNs，因为它们实际上并不在dataframe索引中。这实现了我想要的，但对于一个似乎足够常见的任务来说，似乎有点复杂。data.join( pd

浏览 0提问于2015-12-17得票数 2

1回答

在特定列上添加来自其他数据帧的列，同时保留原始索引

、、、、

Pandas新手入门，并尝试基于两个数据帧共有的列从df2向df1添加列。我想保留df1中的索引。注意，df2有很多重复的行，包括重复的ItemIds。DataFrame 1 0 12 7DataFrame 2 7 85738 7

浏览 9提问于2019-07-09得票数 0

回答已采纳

2回答

如何从具有NaNs的DataFrame中删除重复行？

、、、

我有一个具有200多个特性的dataFrame，我将数据集的一部分用于显示问题： 0 26 5 523 843 2015-09-01 1121.0如您所见，行是重复的(在ID、X1、X2和Date1中)，我希望删除其中一个在ID、X1、X2、Date1和Y1中类似的行，其中包含NaN。因

浏览 0提问于2018-12-27得票数 3

回答已采纳

1回答

、

我正在尝试从位于子目录中的许多csv构建一个数据帧。yield_current_day = 'Energy Yield of Current Day (kWh)'frame = pd.DataFrame第二列从索引的一

浏览 0提问于2018-01-24得票数 0

1回答

从pandas中的字典列表中删除多级列

、、

我有一个包含多级列的dataframe，如下面的MWE中所示：我还有一个字典列表，如下所示： to_keep = [{'aa':'a', 'bb':'b'}, {'aa':'q', 'bb':&

浏览 0提问于2016-10-05得票数 2

3回答

我该怎么做才能解决python中dropna和fillna的问题呢？

、

📷 当我编写此代码来删除具有NaN值的行时； 📷 当我写这段代码来添加"empty“时，它有NaN的值； 📷 我重新启动了我的jupyter笔记本，但它仍然是一样的。

浏览 25提问于2020-03-24得票数 0

回答已采纳

2回答

删除python列表中的重复项，但请记住索引

、、

如何删除列表中的重复项，保持项目的原始顺序，并记住列表中任何项的第一个索引？例如，从[1, 1, 2, 3]中删除重复项会产生[1, 2, 3]，但我需要记住索引[0, 2, 3]。

浏览 2提问于2016-01-02得票数 3

回答已采纳

2回答

删除Pandas中具有不同索引值的重复行

、、、

我有一个包含产品数据的dataframe，产品ID作为索引值存储，其他属性作为列存储。由于人为错误，有时会发生同一项的重复条目，我需要过滤掉这些重复项。对于上一行中的给定重复行，除了、ProductID (索引值)之外，所有内容都是相同的。

浏览 3提问于2020-11-10得票数 0

2回答

Python:从Dataframe中删除重复项

、、

有人知道如何解决这个问题或删除副本吗？可能是因为上面的For循环吗？googlenews = GoogleNews() df = pd.DataFrame

浏览 11提问于2022-04-06得票数 0

1回答

从dataframe中特殊删除重复项

、、

我试图删除重复的行，但有一些特殊的条件。输入数据如下:我要删除重复的行。我必须比较所有的列，因此我必须根据代码对数据进行排序，因此我可以比较行。

浏览 3提问于2020-01-22得票数 0

回答已采纳

1回答

巨蟒大熊猫如何有选择地丢弃复制

、、

我需要查看列'b‘中的所有行，如果该行不是空的，则转到另一个相应的列'c’，并对第三列'c‘中的所有其他行删除此特定索引的重复项，同时保留该特定索引。我不能对整个列使用drop_duplicates，因为我希望在该列中保留可能只对应于'b‘列中空值的重复项。因此，可能的情况是:如果在“b”中找到一个非空值，则可以转到“c”中的当前索引，并找到该索引</

浏览 6提问于2016-09-22得票数 1

回答已采纳

点击加载更多