我有一个分类案例研究,其中我使用Logistic回归模型。我想使用一个热编码将我的分类列(SalStat)值转换为0和1。这是我的代码: data2["SalStat"] = data2["SalStat"].map({"less than or equal to 50,000":0, "greater than 50,000PS: SalStat列将行分类为“小于或等于50,000
例如,如果有一个颜色列(分类变量),其值为“红色”、“蓝色”、“黄色”和“未知”,那么二进制人的热编码将颜色列替换为' color =red‘、' color =blue’和‘color=黄色’。我从熊猫数据框架中的数据开始,我想用这些数据来训练一个与科学知识相关的模型。我知道两种方法来做二进制一热编码,其中没有一种让我满意。
Pandas和get_dummies在数据帧<e