发布于 2019-11-03 17:42:34
检查这份文件:
https://arxiv.org/pdf/1411.4280.pdf
在3.2节中,他们详细讨论了为什么标准辍学在卷积层失败和空间辍学的概念。完全连接的网络通过单个神经元之间的连接学习,而卷积通过特征学习。从某种意义上说,放弃全部特征而不是单个神经元可以被认为是常规辍学的卷积版本。
发布于 2019-06-06 10:21:28
在我看来,整个频道的随机零值代表着信息的损失太大了。因此,我强烈推荐第一种。
但是,我只会在卷积部分之后的稠密层中应用下拉。我认为保存尽可能多的图像数据更好。但这只是个人的偏好/建议。
希望这能帮上忙,否则让我知道。
https://datascience.stackexchange.com/questions/53319
复制相似问题