完全放弃了DSP,来学CUDA,这个基本就是按照毕业设计来做了,所以应该会做很久,应该会写一系列博客,主要是和图像相关的,首先来看CUDA配置,这里主要说的是win10配置。我本来原先编译opencv的时候就用的是VS2015,所以这里也不装新的了,NVIDIA的驱动和CUDA我也是装过的,所以只说下大概的思路,其实这个和配置opencv的时候特别像。
这个安装的时候只要注意把VC++选上就可以了,默认的选项是不加VC++的。另外不要安装更新,联网更新很慢。
这个也很简单,windows的更简单,只需要去官网下载自己对应的版本来装就可以了。
下载地址,当时为了适配tensorflow安装的是8.0版本,现在已经出到9.2了,选择合适自己的就好。 windows版本的exe文件安装还是比较简单的,全部选择默认路径安装就可以了。然后下面是配置:
CUDA_PATH
和CUDA_PATH_V8_0
两个环境变量了,然后把剩下的几个也添加进去。如下图。这里我是用CUDA的sample是的项目来做演示,然后配置64位的属性:
这要是这里标红的这几个库,其实可以到库目录里看见这些lib文件,远不止这几个,复制起来还是挺麻烦的,所以其实可以把所有的lib都添加到这里,我看别人写的配置里只写了这几个也姑且先写这几个吧。
这样就可以了。
可以在C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0
文件夹里找到samples,这是一个VS解决方案,里面有好多个项目,分了8个文件夹,各个文件夹下面有好几个项目。选择对应的VS版本的sln
打开。可以在VS里看到项目,我这里一共是155个项目,可以右键生成解决方案来编译所有的例程,还是比较慢的(i5 7500+1060的显卡大概下来十几分钟,大可不必全部编译),也可以点击某个项目来单独编译,然后将此项目设置为启动项目(右键单击有这个选项),单独运行即可。
选择了image里的boxfilter来测试了一下,大概能跑到70fps的帧率,这就是一个卷积操作,暂时还没有和opencv里的做对比,我感觉这个速度应该只能说一般,不过无论如何环境就算搭建好了,后面的学习慢慢来吧。