dask.DataFrame周围的方法似乎都确保索引列是排序的。但是,通过使用from_delayed,可以构造具有索引列的dataframe,该列没有排序:
pdf1 = delayed(pd.DataFrame(dict(A=[1,2,3], B = [1,1,1([pdf1,pdf2]) #dask.DataFrame with unordered inde
尝试在dask中使用pivot_table,同时维护排序索引。我有一只简单的熊猫数据图,看起来像这样:df = pd.DataFrame({'A':['a', 'values='dist')
print(pivot_dd.known_divisions) # Here I get False, whi