我刚开始使用Dask和Numba来加速代码,我希望这可能是一个有价值的问题,让用户获得如何并行化代码的最佳实践的答案。我已经用3列对pandas数据进行了一个通用的测试。将在框架中的3个向量上实现一个泛型函数,用于表示数据分析中可能进行的转换:前两列被平方、加法,然后取平方根,然后计算一个布尔值,将结果与第三列进行比较。我实现了4个测试用例:(a) pandas应用,(b) Dask,(c) Numba,(d) Da
我试图加快我的代码,提高我对Dask和Numba的理解,我尝试在我创建的示例中使用这两种方法,但是没有改进,我也不明白为什么。更准确地说,是在Windows 10笔记本电脑上,使用Python3.7,在conda环境中拥有Numba和Dask。这是我的代码:import pandas as pdimport dask.dataframe as dd
data(