我正在尝试使用Keras在R中实现一个深度学习模型。假设我有一个人脸的数据集和一个CSV,里面有关于这个人的年龄、性别和种族的信息。我想训练这个模型从照片中预测一个人的年龄。
为此,我必须使用卷积神经网络。这是我的伪码:
library(keras)
model <- keras_model_sequential()
model %>% ## define CNN model’s architecture.
## I will figure this out later
# configure model
model %>% compile(
loss=
通常反向传播神经网络存在着梯度消失的问题。我发现卷积神经网络(CNN)有些如何摆脱这个消失的梯度问题(为什么?)
另外,在一些论文中,还讨论了CNN的一些预培训方法。有人能给我解释一下吗?
(1) the resons for pretraining in CNN and
(2) what are the problems/limitations with CNN?
(3) any relavent papers talking about the limitation of CNN?
提前谢谢。
我正在尝试使用keras建立一个非传统的神经网络,但在有效设置时遇到了问题。 前几层是标准的卷积层,这些层的输出有d个通道,每个通道都有n x n的图像形状。 我想要做的是使用一个密集层将这个d x n x n张量映射到大小为n x n的单个图像上。我想定义一个密集层,输入大小为d,输出大小为1,并将此函数应用于输入上的每个“像素”(输入深度跨通道)。 到目前为止,我还没有找到一个有效的解决方案。我已经尝试了首先定义一个完全连接的层,然后循环到输入中的每个“像素”,然而这需要很多小时来初始化模型,我担心它会减慢backprop,因为计算可能没有正确地并行化。 有没有一种有效的方法来做到这一点