我正在尝试测试使用Python Numba模块的@vectorize装饰器来加速与我的实际代码相关的代码片段的有效性。我正在使用CUDAcast #10 available 中提供的代码片段,如下所示:
import numpy as np
from timeit import default_timer as timer
from numba import vectorize
@vectorize(["float32(float32, float32)"], target='cpu')
def VectorAdd(a,b):
return