我想在catboost中使用交叉验证。由于我不仅希望使用catboost,而且还想使用抽样,所以我使用的是管道,因此不能使用catboost's自己的交叉验证(如果我只使用catboost而不是管道)。所以我想使用sklearn's交叉验证,如果我只使用数值变量的话,效果很好,但是一旦我还包括了分类变量(cat_features)和catboost's编码,cross_validate就不再工作了。这是我的代码中不起作用的部分:
from sklearn.m
我正在尝试将CatBoost应用于我的一个列,以获取分类功能,但得到以下错误: CatBoostError: Invalid type for cat_feature[non-default valueidx=0,feature_idx=2]=68892500.0 : cat_features must be integer or string, real number values and NaN我可以使用one-hot编码,但这里的许多人说CatBoost似乎更好地处理这一点,并且不太容易过度拟合模型。 我的数据由三列组成,“国家”、“
我知道对一个简单的Catboost模型进行网格搜索很容易,比如在这里:https://medium.com/aiplusoau/hyperparameter-tuning-a5fe69d2a6c7gscv.fit(X,y)
print(gscv.best_estimator_)
# initialize Pool