Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >形状'[58,2048,-1]‘对于大小为534528的输入无效

形状'[58,2048,-1]‘对于大小为534528的输入无效
EN

Stack Overflow用户
提问于 2022-11-17 00:55:24
回答 1查看 49关注 0票数 0

我是PyTorch的新手。我在mnist上找到了胶囊网络的示例代码,我将其更改为使用自己的数据集,但它给了我一个运行时错误。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Traceback (most recent call last)
~\AppData\Local\Temp\ipykernel_3248\67117472.py in <module>
    176         train(capsule_net, optimizer,mnist.train_loader, e)
    177         print('start test')
--> 178         test(capsule_net, mnist.test_loader, e)

~\AppData\Local\Temp\ipykernel_3248\67117472.py in test(capsule_net, test_loader, epoch)
    142             data, target = data.cuda(), target.cuda()
    143 
--> 144         output, reconstructions, masked = capsule_net(data)
    145         loss = capsule_net.loss(data, output, target, reconstructions)
    146 

~\Anaconda3\lib\site-packages\torch\nn\modules\module.py in _call_impl(self, *input, **kwargs)
   1108         if not (self._backward_hooks or self._forward_hooks or self._forward_pre_hooks or _global_backward_hooks
   1109                 or _global_forward_hooks or _global_forward_pre_hooks):
-> 1110             return forward_call(*input, **kwargs)
   1111         # Do not call functions when jit is used
   1112         full_backward_hooks, non_full_backward_hooks = [], []

~\AppData\Local\Temp\ipykernel_3248\1108288962.py in forward(self, data)
    142     def forward(self, data):
    143         #2
--> 144         output = self.digit_capsules(self.primary_capsules(self.conv_layer(data)))
    145         reconstructions, masked = self.decoder(output, data)
    146         return output, reconstructions, masked

~\Anaconda3\lib\site-packages\torch\nn\modules\module.py in _call_impl(self, *input, **kwargs)
   1108         if not (self._backward_hooks or self._forward_hooks or self._forward_pre_hooks or _global_backward_hooks
   1109                 or _global_forward_hooks or _global_forward_pre_hooks):
-> 1110             return forward_call(*input, **kwargs)
   1111         # Do not call functions when jit is used
   1112         full_backward_hooks, non_full_backward_hooks = [], []

~\AppData\Local\Temp\ipykernel_3248\1108288962.py in forward(self, x)
     34         u = [capsule(x) for capsule in self.capsules]
     35         u = torch.stack(u, dim=1)
---> 36         u = u.view(x.size(0), self.num_routes, -1)
     37         return self.squash(u)
     38 

RuntimeError: shape '[58, 2048, -1]' is invalid for input of size 534528

图像大小为32*32。有人能告诉我如何纠正这个错误吗?

有3层,Cov层,主上限和数字上限。列车数据集包含100幅图像,测试数据集包含20幅图像。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class ConvLayer(nn.Module):
    def __init__(self, in_channels=3, out_channels=256, kernel_size=9):
        super(ConvLayer, self).__init__()

        self.conv = nn.Conv2d(in_channels=in_channels,
                              out_channels=out_channels,
                              kernel_size=kernel_size,
                              stride=1
                              )

    def forward(self, x):
        return F.relu(self.conv(x))


class PrimaryCaps(nn.Module):
    def __init__(self, num_capsules=8, in_channels=256, out_channels=32, kernel_size=9, num_routes=32 * 6 * 6):
        super(PrimaryCaps, self).__init__()
        self.num_routes = num_routes
        self.capsules = nn.ModuleList([
            nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size, stride=2, padding=0)
            for _ in range(num_capsules)])

    def forward(self, x):
        print(x)
        u = [capsule(x) for capsule in self.capsules]
        u = torch.stack(u, dim=1)
        u = u.view(x.size(0), self.num_routes, -1)
        return self.squash(u)

    def squash(self, input_tensor):
        # take norm of input vectors
        squared_norm = (input_tensor ** 2).sum(-1, keepdim=True)
        output_tensor = squared_norm * input_tensor / ((1. + squared_norm) * torch.sqrt(squared_norm))
        return output_tensor


class DigitCaps(nn.Module):
    def __init__(self, num_capsules=10, num_routes=32 * 6 * 6, in_channels=8, out_channels=16):
        super(DigitCaps, self).__init__()

        self.in_channels = in_channels
        self.num_routes = num_routes
        self.num_capsules = num_capsules

        self.W = nn.Parameter(torch.randn(1, num_routes, num_capsules, out_channels, in_channels))

    def forward(self, x):
        batch_size = x.size(0)            
        x = torch.stack([x] * self.num_capsules, dim=2).unsqueeze(4)

        W = torch.cat([self.W] * batch_size, dim=0)
        u_hat = torch.matmul(W, x)    
        b_ij = Variable(torch.zeros(1, self.num_routes, self.num_capsules, 1))
        if USE_CUDA:
            b_ij = b_ij.cuda()

        num_iterations = 3
        for iteration in range(num_iterations):
            c_ij = F.softmax(b_ij, dim=1)
            c_ij = torch.cat([c_ij] * batch_size, dim=0).unsqueeze(4)

            s_j = (c_ij * u_hat).sum(dim=1, keepdim=True)
            v_j = self.squash(s_j)

            if iteration < num_iterations - 1:
                a_ij = torch.matmul(u_hat.transpose(3, 4), torch.cat([v_j] * self.num_routes, dim=1))
                b_ij = b_ij + a_ij.squeeze(4).mean(dim=0, keepdim=True)

        return v_j.squeeze(1)

    def squash(self, input_tensor):
        squared_norm = (input_tensor ** 2).sum(-1, keepdim=True)
        output_tensor = squared_norm * input_tensor / ((1. + squared_norm) * torch.sqrt(squared_norm))
        return output_tensor


class Decoder(nn.Module):
    def __init__(self, input_width=28, input_height=28, input_channel=1):
        super(Decoder, self).__init__()
        self.input_width = input_width
        self.input_height = input_height
        self.input_channel = input_channel
        self.reconstraction_layers = nn.Sequential(
            nn.Linear(16 * 10, 512),
            nn.ReLU(inplace=True),
            nn.Linear(512, 1024),
            nn.ReLU(inplace=True),
            nn.Linear(1024, self.input_height * self.input_width * self.input_channel),
            nn.Sigmoid()
        )

    def forward(self, x, data):
        classes = torch.sqrt((x ** 2).sum(2))
        classes = F.softmax(classes, dim=0)

        _, max_length_indices = classes.max(dim=1)
        masked = Variable(torch.sparse.torch.eye(10))
        if USE_CUDA:
            masked = masked.cuda()
        masked = masked.index_select(dim=0, index=Variable(max_length_indices.squeeze(1).data))
        t = (x * masked[:, :, None, None]).view(x.size(0), -1)
        reconstructions = self.reconstraction_layers(t)
        reconstructions = reconstructions.view(-1, self.input_channel, self.input_width, self.input_height)
        return reconstructions, masked


class CapsNet(nn.Module):
    def __init__(self, config=None):
        super(CapsNet, self).__init__()
        if config:
            self.conv_layer = ConvLayer(config.cnn_in_channels, config.cnn_out_channels, config.cnn_kernel_size)
            print(self.conv_layer)
            self.primary_capsules = PrimaryCaps(config.pc_num_capsules, config.pc_in_channels, config.pc_out_channels,
                                               config.pc_kernel_size, config.pc_num_routes)
            print(self.primary_capsules)
            self.digit_capsules = DigitCaps(config.dc_num_capsules, config.dc_num_routes, config.dc_in_channels,
                                            config.dc_out_channels)
            print(self.digit_capsules)
            self.decoder = Decoder(config.input_width, config.input_height, config.cnn_in_channels)
            print(self.decoder)
        else:
            self.conv_layer = ConvLayer()
            self.primary_capsules = PrimaryCaps()
            self.digit_capsules = DigitCaps()
            self.decoder = Decoder()

        self.mse_loss = nn.MSELoss()

    def forward(self, data):
        output = self.digit_capsules(self.primary_capsules(self.conv_layer(data)))
        reconstructions, masked = self.decoder(output, data)
        return output, reconstructions, masked

以下是主要功能的相关部分

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
for e in range(1, N_EPOCHS + 1):
        transform = transforms.Compose([transforms.Resize(255),
                                transforms.CenterCrop(224),
                                transforms.ToTensor()])
       
        train(capsule_net, optimizer,mnist.train_loader, e)
        print('start test')
        test(capsule_net, mnist.test_loader, e)
EN

回答 1

Stack Overflow用户

发布于 2022-11-17 06:03:54

您正在尝试在forward类的PrimaryCaps方法中重新构造张量。但是,您正在尝试将其重塑为[58, 2048, -1],但是您有一个534528大小。534528不是58*2048的倍数。我的猜测是,您的self.num_routes的值应该是32 * 6 * 6,但是在代码中的某个地方,您将它定义为2048

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
class PrimaryCaps(nn.Module):
    def __init__(self, num_capsules=8, in_channels=256, out_channels=32, kernel_size=9, num_routes=32 * 6 * 6):
        ...

    def forward(self, x):
        print(x)
        u = [capsule(x) for capsule in self.capsules]
        u = torch.stack(u, dim=1)
        u = u.view(x.size(0), self.num_routes, -1) #HERE
        return self.squash(u)

希望这能有所帮助。

编辑:您可能在这一行上设置了错误的值

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
self.primary_capsules = PrimaryCaps(config.pc_num_capsules, config.pc_in_channels, config.pc_out_channels,
                                           config.pc_kernel_size, config.pc_num_routes)

其中config.pc_num_routes可能设置为2048年,这将覆盖您的32 * 6 * 6值。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74472573

复制
相关文章
echarts 图例修改legend中icon的形状及大小
ECharts 提供的标记类型有 'circle', 'rect', 'roundRect', 'triangle', 'diamond', 'pin', 'arrow', 'none'
李维亮
2021/07/08
11.1K0
cmd输入java有效,输入javac无效解决方案
运行cmd的时候,输入java会有输出,但是输入javac的时候就报javac不是内部或外部命令的错误。
全栈程序员站长
2022/08/24
1.4K0
cmd输入java有效,输入javac无效解决方案
Excel中的无效链接(1)
我们可以断定是C4和G4这两个单元格使用了“河北省”,修改他们的值即可消除无效链接的错误。
东风压倒西风
2022/04/17
2.5K0
【pytorch】改造resnet为全卷积神经网络以适应不同大小的输入
因为resnet最后有一个全连接层。正是因为这个全连接层导致了输入的图像的大小必须是固定的。
西西嘛呦
2020/08/26
3.6K0
【pytorch】改造resnet为全卷积神经网络以适应不同大小的输入
Android为属性组件动画无效
本来我的代码是这样的 然后发现这动画只能在窗体onCreate的时候使用有效。 放在点击事件之类的就不行了。 后经百度发现需要开始动画而不是设置动画 carImg.startAnimation(animation);
SingYi
2022/07/13
7970
Android为属性组件动画无效
CNN中张量的输入形状和特征图 | Pytorch系列(三)
在这个神经网络编程系列中,我们正在努力构建卷积神经网络(CNN),所以让我们看看在CNN中的张量输入。
AI算法与图像处理
2020/04/20
3.8K0
CNN中张量的输入形状和特征图 | Pytorch系列(三)
JS输入框赋值无效踩坑
在我使用Js想要实现自动发帖的时候,需要向输入框中赋值,但现在许多的输入框需要先点击,将鼠标聚焦在框内才可以输入赋值。 如果没有聚焦直接输入,看上去值是输入了,但实际上是没有,再次点击提交后就会显示没有任何输入。
sugarbeet
2022/09/26
6.3K0
理解卷积神经网络中的输入与输出形状 | 视觉入门
即使我们从理论上理解了卷积神经网络,在实际进行将数据拟合到网络时,很多人仍然对其网络的输入和输出形状(shape)感到困惑。本文章将帮助你理解卷积神经网络的输入和输出形状。
磐创AI
2019/10/09
2.2K0
理解卷积神经网络中的输入与输出形状 | 视觉入门
人工智能系统可以调整图像的对比度、大小和形状
人工智能(AI)和艺术并没有你想象的那么对立。事实上,智能系统已经在与艺术家合作,帮助艺术家创作歌曲,制作油画作品,以及制作彩色标识。现在,一名软件开发人员利用人工智能的生成能力来操纵图像中的对比度、颜色和其他属性。
AiTechYun
2018/12/29
1.8K0
人工智能系统可以调整图像的对比度、大小和形状
无效学习 VS 有效学习 (1)
上次我提到了「熵增定律」这个模型, 它告诉我们,要想在地球上生存下去,就要「熵减」,以应对环境的熵增。 那我们为什么要学习?归根结底不是为了生存吗? 那什么是有效学习,什么是无效学习呢? 你可以说,这简单,用你上面那句话套。 凡是符合“熵减”的,都是有效学习。 具体一些呢? …… 还记得昨天说的“外力做功”吗? (我们可以从“房间里放书本”这个例子得到启示) 关于无效学习,我总结了以下四点: 操作多,用脑少 没有明确目标 注重输入,不输出 知识不整理,越积越乱 (由于篇幅过多,我会组成一个系列,分
程序媛淼淼
2022/09/01
2920
输入技巧1
在不知道需要输入多少个数,每个数之间有个空格,当输入换行时结束,如何进行读入操作。
Lokinli
2023/03/09
1190
JavaScript 判断输入的值为数字
使用js自带全局函数isNaN(), isNaN()返回一个Boolean值,如下 :
Devops海洋的渔夫
2019/06/02
3.5K0
oracle APEX中:对于Dialog的做法(1)
APEX中:Dialog的做法(1):利用分支branch跳转 但是需要有提交的动作
用户10510205
2023/04/27
5540
CNN 卷积层输入Map大小计算
对于输出的size计算: out_height=((input_height - filter_height + padding_top+padding_bottom)/stride_height )+1 out_width=((input_width - filter_width + padding_left+padding_right)/stride_width )+1 在以下情况下: 1.四边的padding大小相等。padding_top=padding_bottom=padding_lef
10JQKA
2018/05/09
4010
@Valid 无效,BindingResult中的error为0,解决方案
加上以下依赖即可 <dependency> <groupId>org.hibernate</groupId> <artifactId>hibernate-validator</artifactId> <version>6.1.5.Final</version> </dependency>
devi
2021/08/19
9560
cmd输入java, javac命令都无效详细解决方案
安装jdk后,配置完环境变量,可在cmd输入java和javac都无反应或是提示java不是内部或外部指令
全栈程序员站长
2022/09/01
7.5K1
[知乎作答]·神经网络对于输入的维度不一致的处理
[知乎作答]·神经网络对于输入的维度不一致的处理 本文内容选自笔者在知乎上的一个作答,总结下来作为神经网络对于输入的维度不一致的处理教程。。 1.问题描述 神经网络中,如果每次输入的维度不一致应该怎么处理? 神经网络中,如果每次输入的维度不一致应该怎么处理?假设一队人,有时候这队人有三个(3个输入神经元),有时候这堆人有四个(四个输入)。 2.笔者作答 由于一般网络对输入尺寸有固定的要求。这是为什么呢?因为网络的机构和参数决定了需要固定。这是一个在深度学习开发很常遇到的问题。 解决方
小宋是呢
2019/06/27
3K0
输入年份判断是否为闰年
输入年份判断是否为闰年 运行结果 代码 //导包 import java.util.Scanner; //声明一个类名为Test的类 public class Test { //mian方法 程序入口 public static void main(String[] args) { // 判断是否是闰年 //键盘输入 Scanner scan = new Scanner(System.in); System.out.println("******判断是否是闰年*****
是阿超
2021/10/15
1.9K0
jface databinding:输入无效数值时强制恢复初始值-updateModelToTarget
本文讲述通过自定义Binding,实现floatValue文本框和float类型的绑定,并支持数据校验。通过示例代码,展示了如何在SWT Binding的简单应用场景。同时分析了ValueBinding的实现原理,以及其与Binding的区别。
10km
2018/01/03
1.1K0
jface databinding:输入无效数值时强制恢复初始值-updateModelToTarget
点击加载更多

相似问题

RuntimeError:形状'[1,1024]‘对于大小为50176的输入无效

11

RuntimeError:形状'[-1,784]‘对于大小为614400的输入无效

112

RuntimeError:形状'[128,-1]‘对于大小为378的火把输入无效

220

错误:形状'[-1,270000]‘对于大小为1440000的输入无效

20

RuntimeError:形状'[-1,1031]‘对于大小为900的输入无效

12
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文