我希望将字符串数据转换为数字数据,因为决策树只接受数字数据。当我拥有像Ever_Married是/否这样的二进制字符串数据时,我使用.replace
方法将其转换为数字数据。但是现在我有了一个属性,它有5个不同的选项,私人、自雇、儿童、政府_工作,从不_成功了。使用.replace
将这些属性映射到五个不同的数字值可以吗?这会否影响我的模式,这是否良好的做法?
发布于 2022-11-25 00:56:11
由于标记了scikit-learn
,所以可以使用它的函数preprocessing.LabelEncoder()
将类别转换为数字值。是的,这是个很好的做法。
from sklearn import preprocessing
label_encoder = preprocessing.LabelEncoder()
label_encoder.fit(my_dataframe["status"])
https://datascience.stackexchange.com/questions/116453
复制相似问题