尝试构建a Windows port of Faster-RCNN时出现nvcc fatal : '--ptxas-options=-v': expected a number错误。您可以直接从here访问设置文件(这是一个Python脚本)。 软件环境: - CUDA v10.1
- VS 2019
- Python 3.7
- Windows 10
我工作的集群基于特斯拉M2090 (费米)和另一个基于K20Xm (开普勒)。我在费米星系团上发射的内核比开普勒快2.5倍。这个内核是为开普勒集群编译的,密钥为-arch=sm_35 --ptxas-options=-v,结果是
ptxas info : Compiling entry function '_Z22_repack_one_thread_8_2ILb1EEviPtPPh' for 'sm_35'
ptxas info : Function properties for _Z22_repack_one_thread_8_2ILb1EEvi
我正在尝试使用NVCC选项在CUDA内核中获取一些有关注册使用情况的信息
--ptxas-options=v,虽然具有全局功能,但是一切都很好,但是我在设备上遇到了一些困难,因为
ptxas info : Used N registers
输出中缺少行。我尝试使用noinline关键字,并将它们保存在另一个文件中,涉及调用的全局函数,因为我认为NVCC报告了全局函数的全部寄存器使用情况,包括内联后被调用的设备使用情况,但没有任何更改。我可以获得有关注册使用设备功能的信息,只将它们定义为全局的。
你有什么意见建议?
谢谢!
我试图将我的代码解耦一点,但有些地方失败了。编译错误:
error: calling a __host__ function("DecoupledCallGpu") from a __global__ function("kernel") is not allowed
代码摘录:
main.c (调用cuda主机函数):
#include "cuda_compuations.h"
...
ComputeSomething(&var1,&var2);
...
cuda_computations.cu (具有内核、主机主函数,并包括具
我最近从新的CLion 2020版本开始学习CUDA。我在Windows机器上使用CUDA11.0和CLion 2020.2 EAP (同样的情况也发生在稳定的2020.1.2上) 在项目向导中打开一个新项目时,我从CMake收到以下错误: -- The CUDA compiler identification is unknown
-- Detecting CUDA compiler ABI info
-- Detecting CUDA compiler ABI info - failed
-- Check for working CUDA compiler: C:/Program Fil
我想让cmake告诉我,我的CUDA_NVCC_FLAGS中是否包含"-arch sm_??“。也就是说,我想让cmake告诉我CC信息是否设置好了。
如何使用cmake执行此操作?
如何让cmake进行字符串搜索?我需要使用regExp吗?
像这样的东西:
IF(${CUDA_NVCC_FLAGS} contains "-arch sm_")
MESSAGE("-arch flag has been set"
ELSE()
MESSAGE(" CUDA_NVCC_FLAGS: ${CUDA_NVCC_FLAGS}")
MES
我想使用第二个GPU设备作为linux下的专用设备,以便对内核进行基准测试。
我正在测试的内核是一个没有裁减的SIMD计算内核,而不是disabled连接到GPU上,设备是一个GeForge GTX-480,所以我假设计算能力是2。因此,动态并行等高级特性被禁用。
使用nvidia-smi实用程序,有多种模式来设置GPU。
"Default" means multiple contexts are allowed per device.
"Exclusive Process" means only one context is allowed per devic
我按照的说明用visual studio 2012编译了cuda 5,但我还是收到了这样的提示:
nvcc : fatal error : nvcc cannot find a supported cl version. Only MSVC 9.0 and MSVC 10.0 are supported
导致此问题的原因是什么?
我将我的cuda工具包从5.5更新到6.5。然后执行以下命令
nvcc -arch=sm_52
开始给我一个错误
nvcc fatal : Value 'sm_52' is not defined for option 'gpu-architecture'
这是个虫子吗?或者nvcc 6.5不支持Maxwell虚拟体系结构。
我的项目只有扩展名为*.cpp或*.h的源文件。但它们中的一些调用cuda主机函数并使用cublas库。使用enable_language(CUDA)后,cmake可以在配置阶段找到nvcc:
-- The CUDA compiler identification is NVIDIA 8.0.61
-- Check for working CUDA compiler: /gpfs/share/software/cuda/cuda-8.0/bin/nvcc
-- Check for working CUDA compiler: /gpfs/share/software/cuda/cuda-8.0
我在CLion下运行CMake,当识别CUDA编译器时,它显然使用了太长的路径,并且失败了(根据CMakeError.log文件):
Compiling the CUDA compiler identification source file "CMakeCUDACompilerId.cu" failed.
Compiler: C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v10.2/bin/nvcc.exe
Build flags:
Id flags: --keep;--keep-dir;tmp -v
The ou
我正在使用命令提示符在windows上运行CUDA。当我打开cmd时,当前目录指向主文件夹。当我输入nvcc时,输出是nvcc : fatal error : No input files specified。这意味着我可以使用一个文件运行nvcc。但是,当我输入python时,它显示
'python' is not recognized as an internal or external command,
operable program or batch file.
我需要更改我的目录以运行python。我的问题是,如何在不更改目录的情况下让python运行?就像ubun
我正在尝试将Qt与CUDA集成起来。我正在Ubuntu12.04上工作。我已经安装了CUDA和Qt。
我跟随了这里的步骤-
然而,它仍然给我一个错误。
我就是这么做的。
我在主目录中创建了一个名为“CUDA2”的空Qt项目。
我添加了以下文件
cuda_interface.cu
// CUDA-C includes
#include <cuda.h>
extern "C"
void runCudaPart();
// Main cuda function
void runCudaPart() {
// all your cuda code here *s
我正在尝试使用Visual Studio构建一个CMake项目(打开文件夹模式)。Nvcc是构建项目所必需的。 我得到以下错误: The CUDA compiler
"C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v10.1/bin/nvcc.exe"
is not able to compile a simple test program.
It fails with the following output:
Change Dir: [PROJECT_PATH]/build/Tes
我正试图安装我的MacBook专业上的gpu支持,按照官方指示。
事情进展顺利,直到出现错误:
[ 70%] Building NVCC (Device) object caffe2/CMakeFiles/caffe2_gpu.dir/__/aten/src/THC/caffe2_gpu_generated_THCTensorMath.cu.o
nvcc fatal : The version ('90000') of the host compiler ('Apple clang') is not supported
nvcc fatal : The