文章/答案/技术大牛

发布

社区首页 >问答首页 >向CNN输入固定长度帧序列

问向CNN输入固定长度帧序列
EN

Stack Overflow用户

提问于 2020-09-28 10:06:54

回答 1查看 190关注 0票数 1

我希望我的电筒CNN作为输入，长度为32x32rgb图像的序列连接在通道维度上。因此，网络的单个输入具有形状(32, 32, 3, SEQ_LEN)。如何定义我的CNN输入层？

共同的方式

SEQ_LEN = 10
input_conv = nn.Conv2d(in_channels=SEQ_LEN, out_channels=32, kernel_size=3)

BATCH_SIZE = 64
frames = np.random.randint(0, 255, size=(BATCH_SIZE, SEQ_LEN, 3, 32, 32))
frames_tensor = torch.tensor(frames)

input_conv(frames_tensor)

给出误差

RuntimeError: 4维权重为32、10、3、3的预期四维输入，而

则为大小为64、10、3、32、32的5维输入。

python

pytorch

tensor

conv-neural-network

回答 1

Stack Overflow用户

发布于 2020-09-28 10:28:56

考虑到您的评论，听起来您的数据根本不适合2D卷积神经网络，而3D神经网络(Conv3d)则更为合适。正如您从它的文档中所看到的，它的输入形状正是您所期望的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/64100096

复制

相似问题

问向CNN输入固定长度帧序列
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问向CNN输入固定长度帧序列EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问向CNN输入固定长度帧序列
EN