首先,GridSearchCV使用交叉验证来确定哪个模型表现最好。 然而,在交叉验证中,我们假装作为测试集被留出的一折是不可见的,因此不适合一些预处理步骤(例如缩放或标准化)。...出于这个原因,我们无法预处理数据然后运行GridSearchCV。
其次,一些预处理方法有自己的参数,通常必须由用户提供。...# 创建流水线
pipe = Pipeline([('preprocess', preprocess), ('classifier', LogisticRegression())])
# 创建候选值空间...2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])
'''
带有参数选项的流水线
# 导入所需的包...logistic)])
# 创建 1 到 30 的一列整数(X + 1,特征序号)
n_components = list(range(1,X.shape[1]+1,1))
# 创建正则化参数的一列值