libtorch :如何在data_ptr上创建一个gpu张量？

文章/答案/技术大牛

发布

1回答

、

创建一个基于data_ptr的图形处理器张量？auto ten=torch::randn({3,10},torch::kCuda); auto p=ten.data_ptr<float>();//I believe "p" is a gpu

浏览 75提问于2020-12-23得票数 1

回答已采纳

2回答

如何在LibTorch中对张量中的数字使用大和较小的运算符？

、、

我在LibTorch中有一个一维张量的数字，在C++中，我想用>条件来计算每个数。 from /home/iii/tor/m_gym/libtorch/include

浏览 9提问于2022-08-22得票数 1

回答已采纳

1回答

LibTorch中的固定内存

、、

我可能遗漏了一些非常基本的东西，但我在文档或在线上找不到任何解释我试图将图形处理器at::Tensor复制到CPU上的固定张量，但一旦我复制它，CPU张量就不再被固定。我假设它只是创建一个新的GPU张量副本并分配它，但如果是这样的话，如何复制到预先分配的固定内存？(gpu.sizes(), device(at::kCPU).pinned_memory(true)); std::cout << "Is Pinned: &q

浏览 48提问于2020-08-09得票数 1

回答已采纳

1回答

Libtorch:如何从tensorRT fp16半类型指针创建张量？

、、、、

如何在libtorch中从tensorRT fp16半类型指针创建张量？我正在研究一个检测模型。我把它的主干改成了tensorRT来做FP16推断，解码盒和nms等检测代码都是在libtorch和torchvisoin中完成的，那么如何从fp16半类型指针创建tensorRT张量呢？half_float::half* outputs[18];// to

浏览 0提问于2020-04-24得票数 1

1回答

创建Pytorch“视图堆栈”以保存GPU内存

、

我正在尝试扩展数据集，以便在Pytorch中进行分析，以便从一个一维(或2D)张量中生成两个视图堆栈，生成。在以下图像中，A(绿色)和B(蓝色)是原始张量的视图，这些张量从左向右滑行，然后组合成单个张量进行批处理：使用视图的动机是为了节省GPU内存，因为对于大型多维数据集，这个扩展过程可以将数十MB一次只返回一个视图是不可取的，因为张量的实际处理是在大批量进行的。我在毕道尔做的事有可能吗？简单地使用torch.stack(视图列表)<em

浏览 7提问于2022-03-05得票数 2

回答已采纳

2回答

我如何知道tensorflow张量是在cuda还是cpu中？

、、

我如何知道tensorflow张量是在cuda还是cpu中？tfwith tf.device('/device:GPU在这里，我把张量'a‘和'b’放在GPU上。在打印“a”时，我得到： [[1. 2. 3..]], shape=(2, 3), dtype=float32) 它不提供任何信息，无论

浏览 2提问于2020-10-06得票数 5

回答已采纳

1回答

Pytorch Tensor::data_ptr<long long>()在Linux上不起作用

、、

/libtorch/include -L../libtorch/lib -ltorch -ltorch_cpu -lc10 -Wl,-rpath,../libtorch/lib有什么办法可以解决这个问题吗？另外，我知道pytorch是为cmake设计的，但是我没有使用cmake的经验，也不想为我的应用程序写一个基于cmake的构建系统。然后我在

浏览 71提问于2021-05-18得票数 2

回答已采纳

1回答

LibTorch(C++)与Cuda一起引发了一个异常

、、

我正在尝试用LibTorch 1.3和C++创建NN，使用Cuda10.1和Windows10。对于构建，我使用VisualStudio2019。 auto ne

浏览 1提问于2019-11-15得票数 3

1回答

如何为CIFAR 10 pytorch教程添加GPU计算？

、、、、

有关pytorch的CIFAR10教程可以在这里找到：本教程将介绍如何使用pytorch为CIFAR 10数据集创建简单的卷积神经网络。在接近尾声时，它略微介绍了如何在GPU上实现上述代码。本质上的区别是，我们创建了设备=torch.device(' gpu ')，并在使用它们进行计算之前将所有张量发送到gpu设备。因此，本质上，我们希望在每次进行计算之前将网络对象、输入和标签张量</e

浏览 5提问于2018-12-11得票数 1

1回答

何时需要在模型或张量上使用`.to(设备)`？

、、、

我正在阅读关于这个主题的，它表明这个方法将把张量或模型移动到指定的设备上。但是，我不清楚这是必要的哪些操作，如果我没有在正确的时间使用.to()，我会遇到什么样的错误？例如，如果我只是创建一个张量，我设想张量存储在CPU可访问内存中，直到我将张量移动到GPU。一旦张量在GPU上，GPU将对该张量执行任何数学运算。但是，我是否需要担心不小心将数据张量</em

浏览 3提问于2020-07-23得票数 16

1回答

在Keras中利用分布式学习在多个GPU上分配大张量

、、、

model.compile(loss='mean_squared_error', optimizer=rms, metrics=['mean_squared_error'])| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |+-------------------------------------------------

浏览 25提问于2022-08-05得票数 1

回答已采纳

1回答

利比里亚火炬只有cmake配置文件，但需要使用meson构建。

、、

我正在尝试制作一个cpp项目，该项目使用lib手记(C++发行版)，使用介子构建。它有一个简单的cpp文件，大约50行，对图像进行深入学习。但是，我不知道如何使

浏览 15提问于2021-12-17得票数 0

3回答

哪些功能或模块需要连续输入？

、

据我所知，每当某个函数或模块需要连续张量时，都需要显式调用tensor.contiguous()。/src/torch/lib/TH/generic/THTensor.c:231哪些功能或模块需要连续的输入？有文档说明吗？或者措辞不同，您需要调用contiguous的情况是什么？

浏览 13提问于2021-11-04得票数 4

回答已采纳

1回答

当将张量移动到GPU时，内存会发生什么变化？

、、

张量c被发送到multiprocessing.Pool调用的目标函数步骤内的GPU。在这样做的过程中，每个子进程在GPU上使用487 MB，而RAM的使用则为5 GB。注意，大张量arr只是在调用池之前创建一次，而不是作为参数传递给目标函数。当CPU上的所有东西都在运行时，Ram的使用不会爆炸。关于这个例子，我有以下几个问题：我将torch.Tensor.ones(1)发送到GPU，但它消耗了487 MB的GPU内存。即使基本<em

浏览 0提问于2020-09-25得票数 0

2回答

Pytorch 0.4.0:有三种方法可以在CUDA设备上创建张量。它们之间有什么不同吗？

、

t3仍在CPU上。不知道为什么。

浏览 1提问于2018-11-16得票数 11

回答已采纳

2回答

为什么GPU上的乘法比CPU上的乘法慢？

、、

time.time()我想知道我是不是做错了什么，我如何改变我的代码，以表明GPU比在矩阵乘法上更快？

浏览 0提问于2020-10-27得票数 2

5回答

为什么没有用torch.cuda.empty_cache()发布CUDA内存

在我的Windows 10上，如果我直接创建一个GPU张量，我可以成功地释放它的内存。torchdel a但是如果我创建一个正常张量并将它转换成GPU张量，我就不能再释放它的内存了。

浏览 8提问于2020-09-08得票数 2

回答已采纳

1回答

当我们在一个.data.numpy张量上调用cpu() PyTorch ()时会发生什么？

、

我正在进行一个项目，需要将损失张量中的数据传递给绘图库。是否存在将张量与计算图分离的风险？

浏览 0提问于2020-06-08得票数 2

回答已采纳

1回答

如何将ML项目从GPU项目转换为CPU项目？

我正在学习ML，我想重新训练一个用于车道检测的AI模型。我找到了这个，想试一试。但我一直面临一个问题：我没有GPU，所以我希望我能用我的CPU训练这个模型。但遗憾的是，该代码的某些部分是用CUDA编写的。有没有办法，我可以把这个GPU代码转换成CPU代码？我应该只为CPU训练找到另一个人工智能模型吗？

浏览 8提问于2022-09-08得票数 0

回答已采纳

4回答

cuda和张量内核的区别是什么？

、、

我对与高性能计算相关的术语完全陌生，但我刚刚看到EC2在亚马逊网络服务上发布了由新的Nvidia Tesla V100驱动的新型实例，它有两种“核心”：Cuda核心(5,120)和张量核心(640)。

浏览 106提问于2017-11-17得票数 54

回答已采纳

点击加载更多