one-hot编码
以Type变量为例,进行one-hot编码。为了观察结果方便,把顺序打乱,观察编码后结果。
优缺点
1,通过one-hot编码,可以对特征进行了扩充。
2,连续变量经过编码后,从一个权重变为多个权重,提升了模型的非线性能力。
3,不需要多参数进行归一化处理。
4,随着将大权重拆分成几个小权重管理特征,降低了异常值对模型的影响,增加了模型稳定性。
5,生成了较大的稀疏矩阵。
本文分享自 机器学习养成记 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体分享计划 ,欢迎热爱写作的你一起参与!