问如何真正过滤熊猫数据集而不离开各地的Nans
EN

Stack Overflow用户

提问于 2020-12-18 11:30:24

回答 1查看 65关注 0票数 1

假设我有一个巨大的DataFrame，它只包含少数几个与我执行的过滤匹配的单元格。如何才能在一个新的dataframe中只获得与其匹配的值(以及它们的索引和列)，而不使用整个其他的DataFrame，而后者变成了Nan。使用dropna删除Nans只会删除整个列或行，而filter用Nans替换非匹配项。

这是我的密码：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.random((1000, 1000)))

# this one is almost filled with Nans
df[df<0.01]

python

pandas

filter

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-12-18 11:39:23

如果需要其他格式的不缺失值，可以使用DataFrame.stack

np.random.seed(2020)

df = pd.DataFrame(np.random.randint(10, size=(5, 3)))

# this one is almost filled with Nans
df1 = df[df<7]
print (df1)
     0    1    2
0  0.0  NaN  3.0
1  6.0  3.0  3.0
2  NaN  NaN  0.0
3  0.0  NaN  NaN
4  3.0  NaN  2.0

df2 = df1.stack().rename_axis(('a','b')).reset_index(name='c')
print (df2)
   a  b    c
0  0  0  0.0
1  0  2  3.0
2  1  0  6.0
3  1  1  3.0
4  1  2  3.0
5  2  2  0.0
6  3  0  0.0
7  4  0  3.0
8  4  2  2.0

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/65356280

复制

相似问题

问如何真正过滤熊猫数据集而不离开各地的Nans
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何真正过滤熊猫数据集而不离开各地的NansEN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何真正过滤熊猫数据集而不离开各地的Nans
EN