期望:当我对给定的数据进行分区时,行将大致均匀地分布到每个分区中。然后,当我将数据写入csv时,得到的n个csv(在本例中是10)的长度类似于相同的长度。现实:当我运行下面的代码时,我发现所有行都在export_results-0.csv中,其余的9个csvs是空的,而不是一些均匀的行分布。import dask.dataframe as d
这是一个在xarray和pandas中重采样时间序列的MWE。10Min重采样在xarray中需要6.8秒,在pandas中需要0.003秒。有什么方法可以让x数组中的Pandas速度提高吗?熊猫的重采样似乎独立于这个时期,而x阵列则随着时间的推移而变化。import numpy as npimport pandas as pd
d