我知道numba会创建一些间接费用,在某些情况下(非密集计算),纯python会变得更慢。但我不知道的是在哪里划界线。是否可以用算法复杂度的顺序来确定在哪里?sum_1(a,b): for i,j in zip(a,b): return result
b = np.linspace(1.0,2.0,5)%timeit -o s
我需要能够调用GPU函数,而GPU函数本身又间接调用另一个GPU函数:import numpy as np
@cuda.jit,该函数本身通过euclidean_distance()调用euclidean_distance_gpu(),而compare()和euclidean_distance_gpu()是要使用GPU的函数。据我所知,这两个函数都需要用@cuda