我希望我的电筒CNN作为输入,长度为32x32rgb图像的序列连接在通道维度上。因此,网络的单个输入具有形状(32, 32, 3, SEQ_LEN)
。如何定义我的CNN输入层?
共同的方式
SEQ_LEN = 10
input_conv = nn.Conv2d(in_channels=SEQ_LEN, out_channels=32, kernel_size=3)
BATCH_SIZE = 64
frames = np.random.randint(0, 255, size=(BATCH_SIZE, SEQ_LEN, 3, 32, 32))
frames_tensor = torch.tensor(frames)
input_conv(frames_tensor)
给出误差
RuntimeError: 4维权重为32、10、3、3的预期四维输入,而
则为大小为64、10、3、32、32的5维输入。
发布于 2020-09-28 10:28:56
考虑到您的评论,听起来您的数据根本不适合2D卷积神经网络,而3D神经网络(Conv3d
)则更为合适。正如您从它的文档中所看到的,它的输入形状正是您所期望的。
https://stackoverflow.com/questions/64100096
复制相似问题