的值进行归一化处理,进而影响下一层
的计算.
之后,进行 Batch Normalization 操作,此过程将有
这两个参数控制.这一步操作会给你一个新的规范化的
值.然后将其输入到激活函数中,得到
和
之间进行的运算
决定其方差和均值)
也会引入一些噪音.
是在整个 mini-batch 上进行计算,但是在测试时,你不会使用一个 mini-batch 中的所有数据(因为测试时,我们仅仅需要少量数据来验证神经网络训练的正确性即可.)况且如果我们只使用一个数据,那一个样本的均值和方差没有意义,因此我们需要用其他的方式来得到 u 和
这两个参数.
对数据进行测试
在训练这个隐藏层的第一个 mini-batch 得到
,训练第二个 mini-batch 得到
,训练第三个 mini-batch 得到
...训练第 n 个 mini-batch 得到
.然后利用指数加权平均法估算
的值,同理,以这种方式利用指数加权平均的方法估算
.
在整个 mini-batch 上计算出来的,但是在测试时,我们需要单一估算样本,方法是根据你的训练集估算 u 和
.常见的方法有利用指数加权平均进行估算.
[1]
吴恩达老师课程原地址: https://mooc.study.163.com/smartSpec/detail/1001319001.htm