我正在研究一个神经网络来预测一个事件是否是中微子。每个输入x是一个矩阵:(3,5484),三个不同的度量,5484传感器。
因此,我应该规范网络的输入以使其正常工作,但我对此有疑问,让我们解释一下:
我的数据集是:(x_1,.,x_N)。让我们只关注一个特性,并认为x是一个大小向量(5484)。那么每个x都有一个平均值: mean_x,和一个std :std_x,但是标准化输入的目的是在不丢失信息的情况下消除它(全局规范化,每个输入都有相同的规范化因子),对吗?
所以,我不知道该怎么撤销它。我是否应该将(x_1,.,x_N)平坦为一维向量:(x_1,.,x_5484*N)并计算其均值和标准差?
还是应该独立处理5484个输入通道中的每一个?
我有点迷路了。
发布于 2017-06-27 04:10:12
这取决于你如何对待传感器数据。
如果你认为5484传感器代表了不同的特征,你就不应该把它们夷为平地,而应该把3 * 5484当作图像通道。否则,如果传感器是相似的,你应该把它们压平。
但直觉上,我认为第一种方法更好。
发布于 2017-06-27 04:40:14
如果3个传感器是相互独立的,那么你就有5484*3个特征。对于每一个特性,您都应该将数据扁平化并标准化。
例如,您的所有数据集可能是m* (5484*3)的矩阵,其中m是样本数。矩阵中的每一行都是一个样本。
您可以使用can http://scikit-learn.org/stable/modules/preprocessing.html
https://stackoverflow.com/questions/44768792
复制相似问题