我使用了SimpleImputer()来填充缺失的值
my_imputer = SimpleImputer()
data_with_imputed_values = my_imputer.fit_transform(train_data)我所期望的是,我的数据填充了缺失的单元格的该列的平均值。然而,它只适用于某一列,而不适用于另一列。
为了更好地解释这个问题,下面是计算之前缺少的值的数量。

这是计算后的结果。

为什么它只适用于专栏,而不适用于年龄?
发布于 2023-01-26 13:18:13
在第二个单元格中,您将isnull()打印在train_data上.但是您已经在train_data上应用了imputer并将值赋给了data_with_imputed_values.尝试将第二个单元格中的train_data替换为data_with_imputed_values。
missing_val_count_by_column = (data_with_imputed_values.isnull().sum())
missing_val_count_by_columnhttps://datascience.stackexchange.com/questions/118052
复制相似问题