数据预处理 主要分为 数据归一化 和 PCA/ZCA白化 两种方法。
数据预处理 的 时序位置 在数据扩充之后,模型训练之前:
数据采集 –> 数据标记 –> 数据扩充 –> 数据预处理 –> 模型训练
包括 简单缩放 和 规范化 。
为了使得最终的数据向量落在 0,1 或 -1,1 的区间内(根据数据情况而定)。
在处理自然图像时,我们获得的像素值在 0,255 区间中,常用的处理是将这些像素值 直接除以 255,使它们 缩放到 0,1 中。
示例图:
去均值 结果图:
由于 白化 目前已不常用,这里就不展开探究了。
数据归一化 的 具体实现代码 参见我的另一篇文章:图像预处理: 规范化 。
1(https://cloud.tencent.com/developer/article/1348828)
2(http://ufldl.stanford.edu/wiki/index.php/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86)