我正在尝试使用Cython来加速Python脚本的某些部分。其中一个关键部分将函数应用于Pandas dataframe;由于这是多次完成的,因此我希望用Cython编写这些函数,以获得更快的计算速度。功能如下,并在同一个木星笔记本电池:
%%cython
cimport numpy as np
import numpy as np
cdef double breadth_c_type(np.ndarray[np.float64_t, ndim=1] arr):
""" Calculates range between the maximum and minimum values of a given list. """
return (max(arr) - min(arr))
cdef double evenness_c_type(np.ndarray[np.float64_t, ndim=1] arr):
""" Calculates the sample variance of differences between values in a sorted list. """
cdef np.ndarray[double] sorted_arr
cdef list desc_diff
cdef double m
cdef double var_res
sorted_arr = sorted(arr)
desc_diff = []
for x in range(len(arr)-1):
desc_diff.append(sorted_arr[x+1]-sorted_arr[x])
# following used to avoid usage of numpy
m = sum(desc_diff) / len(desc_diff)
var_res = sum((xi - m)**2 for xi in desc_diff) / len(desc_diff)
return var_res
笔记簿单元格以书面方式成功运行,所以我认为这两个函数都编译成功了。但是,此代码按预期运行:
%timeit rand_df.apply(breadth_c_type, raw=True)
鉴于这一守则:
%timeit rand_df.apply(evenness_c_type, raw=True)
不运行,并返回"NameError:名称'evenness_c_type‘未定义“。在没有%timeit修饰符的情况下,我得到了相同的结果,当使用'cpdef‘或'def’代替'cdef‘时,函数不会编译。由于我试图对这两个函数遵循相同的语法,所以我不知道是什么导致了evenness_c_type的错误。
多亏了@DavidW,编辑了,我发现了evenness_c_type()
函数的问题。它编译和运行良好,尽管速度不如普通的Cython版本。
cdef double evenness_c_type(np.ndarray[np.float64_t, ndim=1] arr):
""" Calculates the population variance of differences between values in a sorted list. """
cdef np.ndarray [double] desc_diff=np.empty(len(arr)-1, dtype = np.float64)
arr.sort()
for x in range(len(arr)-1):
desc_diff[x]=(arr[x+1]-arr[x])
return np.var(desc_diff)
发布于 2020-03-11 17:34:47
原则上,两者都不应该使用timeit
。timeit
接受Python,cdef
函数不是Python。但是,在某些情况下,Cython将自动创建从cdef函数->Python(实际上使其为cpdef
)的转换。
它不使用cpdef
编译的原因是生成器表达式("closures inside cpdef functions not yet supported"
)
var_res = sum((xi - m)**2 for xi in desc_diff) / len(desc_diff)
我收到这样的错误消息,尽管编译器崩溃了,所以它们不是最清楚的。
用一个清单理解来代替它,它会很好(尽管它看起来并不是特别好的优化)
var_res = sum([(xi - m)**2 for xi in desc_diff]) / len(desc_diff)
我怀疑,没有为cdef
函数生成自动转换的原因是这个生成器表达式。
它不编译为def
函数的原因是您指定了一个返回类型。
考虑一下whether you really need to make it cdef/cpdef
。大多数情况下几乎没有什么好处。
https://stackoverflow.com/questions/60640571
复制相似问题