Windows下使用VS Code搭建英伟达CUDA开发环境

用户7353950

发布于 2024-07-05 12:20:25

4.7K0

文章被收录于专栏：IT技术订阅IT技术订阅

在Windows下使用VS Code搭建CUDA开发环境，可以按照以下步骤进行：

1. 安装CUDA Toolkit：

首先，你需要从NVIDIA官网下载并安装CUDA Toolkit。确保选择与你的GPU兼容的版本，以及适合Windows操作系统的版本。下载地址：https://developer.nvidia.com/cuda-downloads

2. 安装cuDNN（可选）：

如果你打算进行深度学习相关的开发，可能还需要安装cuDNN。同样从NVIDIA官网下载对应版本的cuDNN，并按照说明进行安装。下载地址：https://developer.nvidia.com/rdp/cudnn-archive

3. 配置环境变量：

安装完CUDA和cuDNN后，需要将它们添加到系统环境变量中。打开“环境变量编辑器”，找到“系统变量”下的“Path”变量，然后添加以下路径：

- `%CUDA_PATH%\\bin`

- `%CUDA_PATH%\\extras\\CUPTI\\libx64` (如果是Windows x64)

- `%CUDA_PATH%\\include`

4. 安装VS Code：

如果你还没有安装VS Code，可以从官方网站下载并安装。下载地址：https://code.visualstudio.com/download

5. **安装C/C++扩展**：

打开VS Code，进入扩展市场，搜索“C/C++”，并安装Microsoft提供的C/C++扩展。

6. 安装CUDA插件：

在VS Code的扩展市场中搜索“CUDA”，找到合适的CUDA插件并安装。虽然VS Code官方市场上的CUDA插件可能有限，但你可以尝试安装“CUDA for Visual Studio Code”等插件，以获得更好的CUDA开发体验。

7. 配置VS Code的launch.json：

为了能够在VS Code中运行CUDA程序，你需要创建或修改`launch.json`文件。这个文件通常位于`.vscode`目录下。添加如下内容：

json

{

"version": "0.2.0",

"configurations": [

{

"name": "(gdb) CUDA",

"type": "cppdbg",

"request": "launch",

"program": "${workspaceFolder}/a.exe",

"args": [],

"stopAtEntry": false,

"cwd": "${workspaceFolder}",

"environment": [],

"externalConsole": false,

"MIMode": "gdb",

"miDebuggerPath": "C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.2\\bin\\nvcc.exe",

"setupCommands": [

{

"description": "Enable pretty-printing for gdb",

"text": "-enable-pretty-printing",

"ignoreFailures": true

}

],

"preLaunchTask": "build",

"postDebugTask": "clean"

}

]

}

注意将`miDebuggerPath`中的路径替换为你实际的`nvcc.exe`路径。

8. 创建编译任务：

在VS Code中，你需要创建一个编译任务来构建CUDA程序。这可以通过创建`tasks.json`文件来完成，该文件也位于`.vscode`目录下。添加如下内容：

json

{

"version": "2.0.0",

"tasks": [

{

"label": "build",

"type": "shell",

"command": "C:\\Program Files\\NVIDIA GPU Computing Toolkit\\CUDA\\v11.2\\bin\\nvcc.exe",

"args": [

"${file}",

"-o",

"

],

"group": {

"kind": "build",

"isDefault": true

},

"problemMatcher": []

},

{

"label": "clean",

"type": "shell",

"command": "del

"group": "build"

}

]

}

同样，将`command`中的路径替换为你实际的`nvcc.exe`路径。

完成以上步骤后，你就可以在VS Code中编写、编译和运行CUDA程序了。

注意事项 1. CUDA Toolkit和cuDNN版本兼容性确保所安装的CUDA Toolkit和cuDNN版本与你的NVIDIA GPU以及驱动程序版本兼容。不兼容的版本可能会导致运行时错误或者性能问题。 2. 环境变量设置正确* 添加CUDA Toolkit路径至环境变量时，一定要使用你实际安装的CUDA版本和路径，例如`C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.2\bin`。此外，确认`Path`环境变量更新后需要重启命令行窗口或计算机才能生效。 3. VS Code扩展选择选择合适的CUDA插件对于增强VS Code的CUDA开发能力很重要。有些插件可能不再维护，或者与最新版本的VS Code不兼容，因此选择活跃且评价良好的插件。 4. launch.json配置正确 `launch.json`中的`miDebuggerPath`应指向`nvcc.exe`，但实际上是用于启动GDB的路径。这是因为VS Code通过GDB来调试CUDA程序。确保此路径正确无误，否则调试会失败。 5. tasks.json中的编译参数在`tasks.json`中，`nvcc.exe`的命令行参数应该符合你的项目需求。例如，你可能需要添加`-arch=sm_XX`来指定目标GPU架构，或者`-gencode arch=compute_XX,code=\"sm_XX,compute_XX\"`来生成多个架构的代码。 6. VS Code调试限制虽然VS Code支持在本地Windows系统上编译和运行CUDA程序，但其GPU调试功能可能受限或需要额外的配置。对于复杂的GPU调试，你可能需要考虑使用NVIDIA Nsight或在Linux系统上使用VS Code进行远程调试。 7. 更新和维护 CUDA Toolkit、cuDNN和VS Code本身都会定期更新，保持这些组件的最新状态对于避免潜在的bug和兼容性问题非常重要。为了验证在Windows下基于VS Code的CUDA开发环境是否搭建成功，你可以编写并运行一个简单的CUDA程序，例如矩阵加法。

#include <iostream>

#include <cuda_runtime.h>

__global__ void add(int *a, int *b, int *c, int N) {

int index = blockIdx.x * blockDim.x + threadIdx.x;

if (index < N) {

c[index] = a[index] + b[index];

}

int main() {

const int N = 1024;

int *a, *b, *c;

int *d_a, *d_b, *d_c;

// Allocate host memory

a = (int*)malloc(N * sizeof(int));

b = (int*)malloc(N * sizeof(int));

c = (int*)malloc(N * sizeof(int));

// Allocate device memory

cudaMalloc((void**)&d_a, N * sizeof(int));

cudaMalloc((void**)&d_b, N * sizeof(int));

cudaMalloc((void**)&d_c, N * sizeof(int));

// Initialize data

for (int i = 0; i < N; i++) {

a[i] = i;

b[i] = N - i;

}

// Copy data from host to device

cudaMemcpy(d_a, a, N * sizeof(int), cudaMemcpyHostToDevice);

cudaMemcpy(d_b, b, N * sizeof(int), cudaMemcpyHostToDevice);

// Launch kernel

int threadsPerBlock = 256;

int blocksPerGrid = (N + threadsPerBlock - 1) / threadsPerBlock;

add<<<blocksPerGrid, threadsPerBlock>>>(d_a, d_b, d_c, N);

// Copy result back to host

cudaMemcpy(c, d_c, N * sizeof(int), cudaMemcpyDeviceToHost);

// Check result

bool check = true;

for (int i = 0; i < N; i++) {

if (c[i] != N) {

check = false;

break;

}

std::cout << "Result check: " << (check ? "PASS" : "FAIL") << std::endl;

// Free device and host memory

cudaFree(d_a);

cudaFree(d_b);

cudaFree(d_c);

free(a);

free(b);

free(c);

return 0;

}

这段代码首先定义了一个名为`add`的CUDA kernel，用于将两个数组相加。然后，在`main`函数中，它在主机上分配内存，初始化数据，将数据复制到设备上，调用kernel进行计算，最后将结果复制回主机并检查结果的正确性。

要运行这段代码，你需要在VS Code中创建一个新的工作区，将上述代码保存为`.cpp`文件，然后根据之前的指导配置`tasks.json`和`launch.json`。确保`tasks.json`中的编译命令能够正确识别你的CUDA源文件，并生成可执行文件；同时，`launch.json`应正确配置，以便在调试模式下运行生成的可执行文件。

如果一切配置正确，你应该能在VS Code中看到“Result check: PASS”的输出，这意味着CUDA kernel正确执行，矩阵加法的结果符合预期，从而验证了CUDA开发环境的成功搭建。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2024-06-28，如有侵权请联系 cloudcommunity@tencent.com 删除

cuda