我正在实现一个可伸缩的管道,用于清理我的数据并在建模之前对其进行预处理。我的一般想法是,预处理阶段将包括对拆分后需要完成的数据进行操作,以避免数据泄漏。这些通常是:估算(如果不是按恒定值计算)另一方面,数据清理或功能工程是可以对整个数据集执行的操作,例如: """Clean the price feature."""
我试着用MLP学习一些正弦函数。不幸的是,结果在很大程度上取决于随机种子。如何调整MLPRegressor,使结果更少地依赖于随机种子?import numpy as npfrom sklearn.neural_network import MLPRegressorfor i in range(10):
我正在尝试使一个简单的scikit-学习示例工作,但我不断得到的错误:multiclass-multioutput is not supported。我的代码的第一部分遵循任何基本教程,如预期的那样工作:>>> from sklearn import datasets>>> clf.score([X[0]], [