,注意,标准化是针对每一列而言的
x_scale = preprocessing.scale(x)
x_scale
array([[ 0...a 是一个4X3列表,从列看,第一列有0,1 两个特征,第二列有0,1,2 三个特征,第三列有0,1,2,3 四个特征,一共9个,所以输出的第一行[1,0] 代表 向量的第一个数字 0
即第一个特征...有丢失的分类特征值处理
如果训练集中有丢失的分类特征值,必须显式地设置 n_values
假设第二列有4个特征,少了一个,设置n_values=[2,4,4],所以输出一行10个
encoder = preprocessing.OneHotEncoder...处理缺失值
因为各种各样的原因,真实世界中的许多数据集都包含缺失数据,这类数据经常被编码成空格、 NaN,或者是其他的占位符。...', strategy='mean', axis=0)
imp.fit([[1, 5], [np.nan, 7], [7, 6]])
#fit求得第一列特征均值为4,第二列特征均值为6
X = [[