我使用Pyspark在数据集上运行线性回归和k重交叉验证。目前我只能确定最佳模型的均方根误差。但我想要在交叉验证中评估的所有模型的平均RMSE。如何在交叉验证中获得所有评估模型的平均RMSE?from pyspark.ml.regression import LinearRegression
from pyspark.ml.evaluation import RegressionEvaluatorfrom p
我想使用交叉验证,而不是普通的验证集方法,作为一种更好地估计测试错误率的方法。我使用的是基于spark-MLLib Dataframe的API。d4e7a9d3602e> in <module>
C:\Spark\spark-3.1.2-bin-hadoop3.2\python\pysparkmust be either a param map or a list/tuple of par