我希望对df中的每个缩放因子进行缩放,并将这些数据合并到一个更大的数据帧中。由于这个大型数据文件将不适合内存,所以我认为同样地使用dataframe可能会更好。但我不知道如何解决这个问题。下面是我想要实现的,但是使用熊猫的数据。实际情况下的dflarge将不适合内存。import random 'id1': range(1,6),
'a
我试图想出一种快速的方法,在dataframe中添加一个新列,其中所添加的值是基于条件的。有人向我推荐了一种使用numpy的方法,但它相对来说非常慢。我想知道是否有一种与dask相对应的方法,或者是否可以更好地构造numpy查询以提高性能。import dask.dataframe as ddimport dask.threadedim