我的图形处理器Nvidia gtx1050 Ti 我正在尝试在GPU上训练它,但在训练期间我只看到CPU利用率60-90%,GPU大约5%,这可能是由于张量复制到GPU,我不知道。然后尝试将批处理大小减少到16,然后还得到Cuda out out memory错误,显示需要40 MB,并有16mb相同的2.3 GB已使用,共4 GB 最终实现了8批处理,但只使用CPU,不使用GPU我使用批处理大小为128的fastai,它工作得很好,而且使用的是gpu。以下是我基于pytorch图像分类器教程编写的代码
因此,我在我的程序中运行了一个内存使用测试,我将每个元素添加到两个独立的向量中,每个帧(~60 was )。我希望在某个时候,我会开始看到内存泄漏,但是在某个临界点之前,内存使用率一直保持不变。我有一种感觉,这与向量的分配在那个时候会自动增加有关,但我不确定,在网上找不到任何东西。这也解释不了为什么在那个时候分配了这么多额外的内存( CPU上的二等兵拜特斯从800到900,系统GPU内存从20增加到140)。以下是CPU和</