例如,我正在使用Pytorch开发NN,它可以简单地将平面上的点映射为实数 model = nn.Sequential(nn.Linear(2,2),nn.ReLU(),nn.Linear(2,1))因为这个网络定义了一个映射h:R^2->R,所以我想做的是计算这个映射h在训练循环中的梯度。训练集被定义为需要梯度的张量。我的问题是,即使对于每个固定点,输出都是标量,因为我传播的</em
我将批处理大小减为1,清空了cuda缓存,并删除了gc中的所有变量,但我仍然得到了以下错误:RuntimeError: CUDA out of memory.15.78 GiB total capacity; 14.31 GiB already allocated; 2.75 MiB free; 14.78 GiB reserved in total by PyTorchSee documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF
有没有办法,我可以