在Keras中,Conv2D的输入张量通常是维数为batch_size * n * n * channel_size的四维张量。现在我有一个维度为batch_size * N * n * n * channel_size的5D张量,我想为N中的每个i应用最后三个维度的2D卷积层。例如,如果内核大小为1,那么我期望输出的维度为batch_size
让我们看一个在Keras API中使用2D卷积的简单示例: i = Input(shape=(64,64,3))
x = Conv2D(filters=32,kernel_size=(3,3),padding='same',activation='relu') (i) 在上面的例子中,输入图像有3个通道,卷积层将产生32个特征映射。2D卷积层是否</e
我在看这个层层打印出来的照片。我意识到,这显示了输入/输出,但与如何处理RGB通道无关。如果你看block1_conv1,上面写着"Conv2D“。但是如果输入是224 x 224 x3,那就不是2D了。
我更大、更广泛的问题是,在整个培训过程中,如何处理3通道输入(我认为这是VGG16)。RGB通道是否在某个时候合并(求和或连接)?何时何地?为此需要一些独特的过滤器吗?还是模型从端到端分别运行在不同的通道/颜