另一种反向传播方程的表示方式: 我已经给出了使用 Hadamard 乘积的反向传播的公式(尤其是 (BP1) 和 (BP2))。如果你对这种特殊的乘积不熟悉,可能会有一些困惑。下面还有一种表示方式,那就是基于传统的矩阵乘法,某些读者可能会觉得很有启发。(1)证明(BP1) 可以写成:
证明 (BP2) 可以写成
结合(1)和(2)证明
证明方程 (BP3) 和 (BP4)。
\large \color{blue}{ δ_j^l = \frac{∂C}{∂b^l_j} \frac{∂bl_j}{∂zl_j} = \frac{∂C}{∂b^l_j} \frac{∂(z_j^{l} - \sum_kw_{jk}{l}a{l-1}_k)}{∂z^l_j} = \frac{∂C}{∂b^l_j}}
#2.6 反向传播算法
使用单个修正的神经元的反向传播。假设我们改变一个前馈网络中的单个神经元,使得那个神经元的输出是
,其中 f 是和 S 型函数不同的某一函数。我们如何调整反向传播算法?
把$ σ()换成f()$
线性神经元上的反向传播假设我们将非线性神经元的 σ 函数替换为 σ(z) = z。重写反向传播算法。
(2)中
(3)中
(4)中