前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CUDA编译器nvcc的用法用例与问题简答

CUDA编译器nvcc的用法用例与问题简答

作者头像
恋喵大鲤鱼
发布2018-08-03 16:17:04
2.9K0
发布2018-08-03 16:17:04
举报
文章被收录于专栏:C/C++基础C/C++基础

本文使用nvcc版本:Cuda compilation tools, release 5.5, V5.5.0


1.nvcc支持OpenMP

书写makefile时,使用-fopenmp命令选项时会报nvcc fatal : Unknown option ‘fopenmp’错误。正确的编译选项是:

代码语言:javascript
复制
-Xcompiler -fopenmp

2.nvcc指定GPU计算能力

在内核中调用原子函数(例如atomicAdd)时,如果编译的时候出现”error: identifier “atomicAdd” is undefined”;

那么首先要确定的GPU显卡计算能力是否在1.1或者1.1以上,原子性操作在低端的计算能力 GPU 是不支持的,1.1 以上的计算能力才支持全局内存的原子操作,1.2 以上的计算能力才支持共享内存的原子操作。

使用原子操作的话在编译的时候需要指明GPU的计算能力,添加如下nvcc的编译选项:

代码语言:javascript
复制
-gencode=arch=compute_35,code=\"sm_35,compute_35\"

3.nvcc提示警告

使用 nvcc -Wall时会提示nvcc fatal : Unknown option ‘Wall’的错误。原来nvcc默认开启所有警告,如果想禁止警告,使用-w编译选项。

具体使用nvcc --help查看帮助。


附1 nvcc编译CUDA实际项目makefile

代码语言:javascript
复制
# Check for 32-bit vs 64-bit
PROC_TYPE = $(strip $(shell uname -m | grep 64))

ifeq ($(PROC_TYPE),)
    FLAGS+= -m32
else
    FLAGS+= -m64
endif

#cuda install path
CUDA_INSTALL_PATH ?= /usr/local/cuda-5.5

#environment variable VPATH
VPATH=./include

#gpu architecture
GENCODE_SM35 := -gencode=arch=compute_35,code=\"sm_35,compute_35\"

CXX=nvcc
CXXFLAGS=-g -Xcompiler -fopenmp -DDEBUG
CXXFLAGS+=$(FLAGS) $(GENCODE_SM35)

#source files
CXXFILES = $(wildcard src/*.cpp)
CUFILES  =$(wildcard src/*.cu)

#header files
INCLUDES= -Iinclude -I${CUDA_INSTALL_PATH}/include

#static lib
LIBDIR=./lib
LIBS=$(LIBDIR)/libxmlextern.a

#preprocess
OBJDIR=./obj
NOTDIR_CXXFILES=$(notdir ${CXXFILES})
NOTDIR_CUFILES=$(notdir ${CUFILES})
OBJS=$(addprefix ./obj/,$(patsubst %.cpp,%.o,${NOTDIR_CXXFILES})) 
OBJS+=$(addprefix ./obj/,$(patsubst %.cu,%.o,${NOTDIR_CUFILES})) 

#compile
DICUALG.out:${OBJS}
    $(MAKE) -C ./src/xmlparser
    $(CXX) -Xcompiler -fopenmp -o $@ $^ $(LIBS) 

${OBJDIR}/%.o :src/%.cpp
    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@

${OBJDIR}/%.o :src/%.cu
    $(CXX) ${CXXFLAGS} ${INCLUDES} -c  $< -o $@

${OBJDIR}/md5.o ${OBJDIR}/common.o:macro.h
${OBJDIR}/GPU_Decomposer3.o:cnre.h gpu_define3.h global.h 

.PHONY:clean
clean:
    rm obj/* ./DICUALG.out

具体不详细解释,有问题可留言提问。


参考文献

[1]NVCC命令编译选项.http://blog.csdn.net/k346k346/article/details/50377714 [2]http://www.tuicool.com/articles/uIj2q2

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2015年12月27日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.nvcc支持OpenMP
  • 2.nvcc指定GPU计算能力
  • 3.nvcc提示警告
  • 附1 nvcc编译CUDA实际项目makefile
  • 参考文献
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档