我正在创建一个函数,该函数读取整个文件夹,创建一个Dask数据帧,然后处理该数据帧的分区并对结果求和,如下所示: import dask.dataframe as dd total = delayed(sum)(partial_results)
return total 在partitions_func (another_function)中调用<em
我正尝试在Dask中执行groupby函数来创建一个新的Dask数据帧。然而,当我做groupby时,结果是一个熊猫系列。当我在Pandas中执行相同的操作时,我确实返回了一个新的数据帧。如何返回新的dask数据帧?, 'Forecast_Category'], as_index=False).Total.sum() t