当我在我的RDD上使用collectAsMap而不是rdd.collect().toMap时,是否会对性能产生影响?我有一个键值rdd,我想转换为HashMap,因为我知道collect()在大型数据集上运行时效率不高,我可以使用collectAsMap代替它吗?这会影响性能吗?原件:val QuoteRDDData=QuoteHashMap.values.toSeq
val QuoteRDDSet=sc.parallelize(Qu
data[:,0] # some numbers from the first column of data对我来说挺好的。现在,我想尝试将map()替换为pool.map(),如下所示:pools.map(plotFrame, ids)为什么map()不抱怨没有传递给函数的data变量,但是pool.map()抱怨呢?
编