cuda和张量内核的区别是什么？_使用cuda和float张量的问题_张量(Tensor_list)和张量.numpy()的区别 - 腾讯云开发者社区

、、

我对与高性能计算相关的术语完全陌生，但我刚刚看到EC2在亚马逊网络服务上发布了由新的Nvidia Tesla V100驱动的新型实例，它有两种“核心”：Cuda核心(5,120)和张量核心(640)。两者之间的区别是什么？

浏览 106提问于2017-11-17得票数 54

回答已采纳

1回答

机器学习中的张量内核是什么？

、、

机器学习中的张量内核是什么？张量核和普通核(如RBF核)有什么区别？当使用张量核时，它们的优缺点是什么？

浏览 3提问于2018-05-29得票数 2

2回答

OpenAcc标准中内核和并行指令的区别

、、、

我已经使用支持OpenAcc的PGI编译器在GPU上启动了大约3年的代码，但是到目前为止，我无法理解“内核”和“并行”这两个术语之间的区别。我在“OpenAcc入门指南”中读到：定义应该编译以便在加速器设备上并行执行的程序区域。定义程序的区域，该区域应该被编译成一系列内核，以便在加速器设备上执行。我不明白“加速器设备上的并行执行”和“编译成一系列用于在加速器设备上执行

浏览 1提问于2019-12-17得票数 1

回答已采纳

1回答

`torch.Tensor`与`torch.cuda.Tensor`的差异

.], device='cuda')在GPU上分配张量。使用这种方式而不是使用torch.cuda.Tensor([1., 2.])有什么不同，除了我们可以将一个特定的CUDA设备传递给前者吗？或者换句话说，在哪种场景中需要torch.cuda.Tensor()？

浏览 0提问于2018-12-05得票数 9

回答已采纳

2回答

如何修复“输入和隐藏张量不在同一装置上”的问题

、、、、

当我想将模型放到GPU上时，我会得到以下错误：for m in model.parameters():if torch.cuda.is_available():

浏览 3提问于2019-09-25得票数 8

回答已采纳

2回答

Model.to(设备)和model=model.to(设备)有什么区别？

、

假设模型最初存储在CPU上，然后我想将其移动到GPU0，那么我可以这样做：model = model.to(device)model.to(device) 这两行之间的区别是什么？

浏览 5提问于2020-01-02得票数 13

1回答

无法计算torch.cuda.FloatTensor的点积

我使用GPU计算了神经网络和torch.cuda.FloatTensor (两者都存储在GPU中)输出的点积，但得到了一个错误：p = torch.exp(vector.dot(ht)) 这里的矢量是torch FloatTensor，h

浏览 2提问于2017-07-03得票数 1

1回答

如何在RTX GPU中用python和numba编程NVIDIA的张量核？

、、、、

我感兴趣的是在python中使用NVIDIA RTX GPU的张量核，以便在一些科学计算中受益于它的速度。Numba是一个伟大的库，它允许为cuda编程内核，但是我还没有找到如何使用张量核。

浏览 2提问于2020-06-20得票数 0

回答已采纳

1回答

RuntimeError:预期所有张量都在同一个设备上，但是至少发现了两个设备，cuda:1和cuda:0！当使用变压器架构时

、、、、

通过将nn.dataparallel放在object.However模型上，以前研究过的使用pytorch的训练是可能的，这种方法一直工作到seq2seq为止，但是变压器返回以下错误： RuntimeError:1 and cuda:0!目前，该设备被设置为cuda，nn.dataparallel只应用于最终的变压器模型，只有编码器和解码器除外。device = torch.device("cuda" if torch.cuda.i

浏览 59提问于2022-10-28得票数 0

2回答

默认情况下如何在GPU上运行PyTorch？

、

我想使用cuda运行PyTorch。我为所有张量设置了model.cuda()和torch.cuda.LongTensor()。如果我使用了.cuda，是否必须显式地使用model.cuda()创建张量默认情况下，是否有一种使所有计算在GPU上运行的方法？

浏览 1提问于2017-05-05得票数 10

回答已采纳

2回答

pytorch实例张量即使使用显式cuda()调用也未移动到gpu

、、、

我正在处理一个项目，在这个项目中，模型需要访问类的构造函数init中声明的张量(im子类torch.nn.Module类)，然后我需要通过一个简单的matmul()方法在forward()方法中使用这个张量，通过cuda()调用将模型发送到gpu：model.cuda()model(X) # or model.forward(X)我得到了 RuntimeError: torc

浏览 1提问于2019-01-12得票数 7

回答已采纳

3回答

为什么printf()在内核中工作，但是使用std::cout却不能工作？

、、、

我一直在探索并行编程领域，并用Cuda和SYCL编写了基本内核。我遇到了必须在内核中打印的情况，我注意到内核中的std::cout不工作，而printf工作。例如，考虑以下SYCL代码--这是有效的- buffer<float, 1> Buffer{A, {N}}; queue Queue--类似的情况会发生在CUDA内核中。这

浏览 4提问于2021-02-01得票数 1

回答已采纳

1回答

使用带有自定义CUDA扩展的torch.nn.DataParallel

、、、

但是，当按照CUDA编写自定义操作时，给出的LLTM示例执行批处理不变的操作，例如按元素计算Sigmoid函数的梯度。std::vector<at::Tensor> op_cuda_forwardat::Ten

浏览 1提问于2018-07-18得票数 37

回答已采纳

1回答

为什么选择Eigen来做TensorFlow？

、、

有没有关于如何选择Eigen的公开解释，以及它们是否有在TensorFlow C++ op内核中使用Eigen的动机？

浏览 3提问于2017-01-07得票数 19

回答已采纳

1回答

基于cpu的fp16推理

、、、

我有一个pretrained pytorch模型，我想在fp16而不是fp32上推断，我已经在使用gpu时尝试过了，但是当我在cpu上尝试它时，我得到了："sum_cpu" not implemented for 'Half' torch。有什么修复方法吗？

浏览 0提问于2020-05-31得票数 0

1回答

如何理解如何在PyTorch中创建叶张量？

、、

来自PyTorch b.is_leaf# b was created by the operationthat cast a cpu Tensor into a cuda Tensor e.is_leaf f = torch.rand

浏览 3提问于2020-12-15得票数 7

回答已采纳

2回答

如何通过Vulkan使用Nvidia的张量核心

、、

如何利用Nvidia的张量核(在计算机着色器中)？！用Vulkan？更具体地说，我想深入到过滤器中去噪更多一点。据我所知，滤波器通常需要精确的

浏览 5提问于2019-01-23得票数 7

回答已采纳

4回答

CUDA核和CPU核有什么区别？

、

我用过一点CUDA，也用过很多CPU，我正在尝试理解这两者之间的区别。我的I5处理器有4个内核，售价200美元，而我的NVidia 660有960个内核，价格大致相同。如果有人能解释一下这两个处理单元架构在能力、优缺点方面的关键区别，我会非常高兴。例如，CUDA核心是否有分支预测？

浏览 21提问于2014-01-08得票数 27

回答已采纳

2回答

Tensorflow新Op CUDA内核内存管理

、

我已经在Tensorflow实现了一个相当复杂的新操作系统，它有一个GPU CUDA内核。此操作需要大量动态内存分配变量，这些变量不是张量，在操作完成后被解除分配，更具体地说，它涉及使用哈希表。现在我正在使用cudaMalloc()和cudaFree()，但是我注意到Tensorflow有自己的类型Eigen::GPUDevice，它能够在GPU上分配和释放内存。我的问题：使用Eigen::GPUDevice管理GPU内存是最佳实践吗？通过使用E

浏览 1提问于2018-02-02得票数 6

回答已采纳

2回答

Pytorch，输入(正常张量)和重量(库达张量)失配

、、

免责声明--我知道，这个问题已经问过很多次了，但是我尝试过他们的解决方案，没有一个对我有用，所以在所有这些努力之后，我找不到任何其他的东西，最终我不得不再问一次。我正在用cnns (PYTORCH)进行图像分类，我不想在GPU (nvidia gpu，兼容cuda/cuda )上训练它，我成功地在上面安装了网络，但问题在于数据。if torch.cuda.is_available(): device = torch.device("cuda:0")

浏览 3提问于2020-07-21得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云