我试图用卷积神经网络来预测非流数据的活动(例如跑步、坐着、走路)。与不标准化或规范化培训和测试数据相比,标准化或规范化培训和测试数据可以显著提高网络的预测性能。到现在为止还好。
然而,我考虑让我的方法也适用于流数据。但是,从理论上讲,我不能想象标准化或规范化的流式数据工作。因为,为了标准化,您需要知道均值和标准偏差,这可能随着每一个新输入的数据点的变化而改变。对于规范化,您需要知道数据的最小值和最大值,这也可能随着每个新的数据点的到来而改变。由于是这样,标准化或标准化培训数据甚至没有意义,因为这将意味着为培训和未见数据创建不同的分布。
我不太确定我是不是漏掉了什么东西。但是,对于流数据是否有解决办法,以便可以应用标准化或规范化?
发布于 2022-07-01 20:37:57
所缺少的是,几乎所有您将要培训的模型都假定假设,您的培训分布在某种程度上是恒定的。如果您的数据不断变化,那么您必须继续更新/再培训您的模型,因此您必须重新修改您的规范化器这一事实并不重要。与任何ML模型的拟合相比,均值/std的估计具有极低的样本复杂度,所以如果你的模型不发散,你的归一化者也不会。
https://stackoverflow.com/questions/72834374
复制相似问题