我正在尝试实现一个预测python股票市场的神经网络。在输入中,我有一个2d的numpy数组,我想将数据规范化。我试过使用这段代码,但我没有--这是这类任务的最佳选择。
def normData(data):
#data_scaled = preprocessing.scale(data)
data = scale( data, axis=0, with_mean=True, with_std=True, copy=True )
return data
您是否知道其他更适合此任务及其python实现的规范化过程?谢谢
更新:现在在规范化之前,我从ndarray转到列表,但是打印。
print data.mean(axis=0)
平均值远未达到0。差不多是4。有什么想法吗?
发布于 2016-12-15 13:56:39
我个人会使用科学工具包-学习的标准标量模块。它允许你选择你想要的平均值和标准差,而且非常快。
from sklearn.preprocessing import StandardScaler
# Load data and split into testing and training data
scale = StandardScaler(with_mean=0, with_std=1)
scale.fit(training_data, training_label)
new_training_data = scale.transform(training_data)
new_testing_data = scale.transform(testing_data)
与文件的链接:
http://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.StandardScaler.html
https://stackoverflow.com/questions/41165642
复制相似问题