我有一个数据集,我使用标准标量执行了OneHotEncoding和标准化操作,现在我已经对数据进行了预处理,我必须将其可视化,但是在将数据转换为熊猫数据时,它显示了错误。我已经采取的步骤
categorical_features = [column names which are categorical in nature
例如,如果有一个颜色列(分类变量),其值为“红色”、“蓝色”、“黄色”和“未知”,那么二进制人的热编码将颜色列替换为' color =red‘、' color =blue’和‘color=黄色’。我从熊猫数据框架中的数据开始,我想用这些数据来训练一个与科学知识相关的模型。我知道两种方法来做二进制一热编码,其中没有一种让我满意。
Pandas和get_dumm