我有一个pandas dataframe,其中包含分类列和数值列。默认情况下,df.describe()仅返回数值数据的摘要(使用count、mean、std、min、quantiles、max描述这些列)
当迭代df中的所有列并将它们单独描述为[df[c].describe() for c in df.columns]时,将根据特定的列数据类型返回描述;即,in
因此,我有一个包含分类和数值混合的DataFrame,它当前是12345 171 171列。 我在分类变量和数值中都有缺失值,我想要将值归因于这些值。对于数字列,我执行以下操作; import pandas as pd
from sklearn.preprocessingimp.fit_transform(data) 然后,我得到了以下错误 Val