我在pandas中运行了一个很长的ETL管道。我必须创建不同的pandas数据帧,并且我想为一些数据帧释放内存。我一直在阅读如何释放内存,我发现运行此命令不会释放内存: del dataframe 下面是这个链接:How to delete multiple pandas (python) dataframes在答案中,他们说将数据帧放在列表<e
假设我在python中创建了一个函数,所以将一个数字求幂为2: def squared(s):%sql select id, squaredWithPython(id) as id_squared from test 那么,如果数据分布在工作节点的内存上,squaredWithPython函数是否会在群集的工作节点上运行?如果是,那么矢量化UDF的</