现在我使用的是dplyr:其中func_args只是函数getFeaures我正在尝试使用plyr::ldply和parallel=TRUE来完成这个任务,但是在getFeatures中存在一个问题,我正在使用我编写的另一个函数。Error in do.ply(i) :
task 1 failed - "could not find function "despars
library(itertools)library(doParallel)
workers <- ip address of 4如果我使用doMC,即使用同一台机器的内核,则此代码运行良好。但是,当我试图使用其他计算机进行并行计算时,就会出现上述错误。当我将其更改为registerDoSNOW时,错误仍然存在。我可以使用雪花在本地主机上创建节点,但不能在集群上创建节点。有人在外面玩雪吗?
我正在看2017年的PyData谈话,其中演讲者提供了如何使用FunctionTransformer for sklearn.preprocessing的示例
from sklearn.preprocessing我认为可以更简单地使用.apply()来完成这一任务。我认为,数据分析师导入FunctionTransformer的原因肯定还有其他原因。有人能帮助我理解.apply()方法与FunctionTransformer的区别吗?