我试图通过将用户的RDD映射到模型的recommendProducts方法来从MatrixFactorizationModel中提取预测。这给了我一个MapPartitionsRDD。For more information, see SPARK-5063.at org.apache.spark.rdd.<em
在我当前的实现中,我使用paritions调用并行调用,但是在调用下一个调用之前,它们正在等待响应。Dataframe.rdd.reparition(TPS allowed on API) val response = callApi(row)我想在不等待响应的情况下调用这些调用,确保100个TPS,然后一旦收到响应,我就想在响应的基础上解析和创建Dataframe。我以前尝试过收集行并从主节点调用</e
我有一个非常简单的代码: return (x, n)
for i in range(2): rdd = rdd.map(lambda x: fun(x, i))
a = sc.union(rdds)由于对RDDs的延迟评估,用于创建RDDs的i的值似乎是它在调用collect()时所承载的值,即1(来自f