= digits.images.reshape((n_samples, -1))
y = digits.target
# 将数据集分成训练集和测试集
X_train, X_test, y_train,...y_test = train_test_split(X, y, test_size=0.5, random_state=0)
# 设置gridsearch的参数
tuned_parameters =...k-fold,然后返回最优的模型参数
clf.fit(X_train, y_train)
#输出GridSearch计算结果
clf.cv_results_
#在测试集上测试最优的模型的泛化能力.
y_true..., y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))
(可左右滑动)
?...3.在CDSW上运行pyspark代码代码同样也需要安装scikit-learn和spark-sklearn依赖包。