我知道有一些软件包可以可视化缺少的值,比如missingno
。如果没有使用Pandas和Matplotlib的额外包,我如何可视化丢失的值模式?我希望看到以下图像,其中缺少的数据是白色的:
发布于 2021-10-12 14:29:28
您可以使用matplot获得所需的内容:
import pandas as pd
plt.rcParams["figure.figsize"] = (20, 10)
df = pd.read_excel("C:/Users/Jhonny/Desktop/titanic.xlsx")
plt.imshow(df.isnull(), cmap='hot', aspect='auto')
plt.show()
注意:我使用了kaggle的泰坦尼克号数据的子集。
结果:
从索引0开始,这个热图可视化立即告诉我们丢失的值是如何分布的(以及分布在哪里)。
我知道,我现在不太喜欢。Matplot需要更多的工作才能把这个原始图形变成更好的东西。
但如果你想要更好更快的东西,我真的建议seaborn
。
Seaborn
是一个基于matplotlib的Python数据可视化库。它提供了一个高层次的界面,绘制有吸引力和信息丰富的统计图形.
import seaborn as sns
sns.heatmap(df.isnull(), cbar=False)
plt.show()
https://stackoverflow.com/questions/69539114
复制相似问题