我尝试在Dask数据帧的多个分区上运行一个函数。该代码需要解压元组,并且可以很好地与Pandas一起工作,但不能与Dask map_partitions一起工作。Pandas dataframe# Run function over Daskdataframe在这里,is below:ValueError('not
我创建了一个Aggregation对象来模拟pandas的first操作,它可以很好地处理daskdataframe,但是在延迟函数中使用时,它会给出一个pandas错误'Aggregation' objectis not callable,而在本例中,只使用pandas就可以了。在后来的检查中,我发现在添加@delayed装饰器时,我的接收DaskDataFrame