我正在使用fastai Intro to Machine Learning course,在Lesson 1中,他使用了来自Kaggle的Blue Book for Bulldozers dataset上的随机森林。让我感到奇怪的是,讲师没有使用SKlearn的pd.get_dummies()或OneHotEncoder来处理分类数据。取而代之的是,他对所有分类列调用了pd.Series.cat.codes。我注意到当调用fit()方法时,它在使用pd
我正在进行预测建模,我需要预测一个在线客户最终是否会在一个网站上购买一个产品,我使用的是随机森林分类器和支持向量机,因为这是一个分类问题。在创建了用于培训、测试和验证集的拟合分块之后,我对数据进行了虚拟、标准化和规范化。然而,当我将集合规范化之后,它们的价值就都变成了负值。有没有办法改变这种状况,为什么会发生这种情况?用于规范拟合集的代码如下:
data_preparer = Da