有没有一种pythonic式的方法可以将sklearn的StandardScaler实例链接在一起,以独立地与组一起扩展数据?也就是说,如果我想找到独立缩放虹膜数据集的特征,我可以使用以下代码:
from sklearn.datasets import load_iris
data = load_iris()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['class'] = data['target']
means = df.groupby('class').mean()
stds = df.groupby('class').std()
df_rescaled = (
    (df.drop(['class'], 1) - means.reindex(df['class']).values) / 
     stds.reindex(df['class']).values)在这里,我用平均值减去,再用每组的stdev独立除以。但是很难随身携带这些方法和stdev,基本上,当我有一个我想要控制的分类变量时,复制StandardScaler的行为。
有没有一种对pythonic /sklearn更友好的方式来实现这种类型的伸缩?
https://stackoverflow.com/questions/55601928
复制相似问题