尝试构建a Windows port of Faster-RCNN时出现nvccfatal : '--ptxas-options=-v': expected a number错误。您可以直接从here访问设置文件(这是一个Python脚本)。 软件环境: - CUDA v10.1- Python 3.7
- Windows 10
问题是nvcc同步编译这些目标,这可能需要相当长的时间。有没有办法把它分成多个CPU核?我用的是制造系统。我可以在不同的异步nvcc调用中手动为每个体系结构创建.ptx或.cubin文件,很容易使用每个体系结构的不同的make目标。但是,如何将这些合并成一个最终的.o文件,以便与我的主机代码链接在一起?但是,当我尝试这样做时,我会得到错误:
nvccfatal : A single input file is required for a non-link phase when a