我很好奇每个图像的标准化和整个数据集的标准化之间的区别。
我使用的是tensorflow/模型/官方/resnet,它是用tf.estimator构建的。tf估计器支持产生tf数据集的输入流水线函数。Dataset对象应用标准化操作,该操作通过从每个像素减去图像本身的平均值来标准化,并强制单位方差。
这与其他基于整个数据集的平均值来标准化图像的ML预处理不同,例如使用sklearn.preprocessing.StandardScaler。
对于这个输入管道的任何方面是否持久化在从SavedModel导出的tf tf.estimator.Estimator中,我感到困惑。
因此,我想知道,在为模型提供服务时,无论是通过tf.contrib.predictor还是在以任何其他dnn格式部署模型时,是否仍然需要应用特性标准化。
即使我使用的是per_image_standardization,也应该在整个数据集中应用标准化吗?如果是这样的话,我是否应该以某种方式从整个映像集中导出平均值,以便服务器在为模型服务时能够从整个数据集中获取平均值,并以这种方式进行标准化?
https://stackoverflow.com/questions/54155481
复制相似问题