http://blog.csdn.net/u011239443/article/details/77947043
低偏差高方差,则表示泛化能力不强,可能过拟合。 高偏差,则表示可能还欠拟合。
对于S类激活函数,当W接近与零时,激活函数更加趋近于线性函数,所以不会有太复杂的划分:
更多理解和先参阅:http://blog.csdn.net/u011239443/article/details/76360294#t49
测试阶段不使用Dropout
参阅:http://blog.csdn.net/u011239443/article/details/76360294#t3
归一化的好处:
初始化权值尽可能的接近于0,梯度下降的速度才能尽可能的快,所以讲初始化乘以一定的系数:
基本的数学概念,不记录。