toarray()
输出:[ [0,1,0,0] , [0,0,1,0] , [1,0,0,0] ,[0,0,0,1] ]
二.字符串型类别变量
OneHotEncoder无法直接对字符串型的类别变量编码...pandas 自带的get_dummies函数即可
get_dummies的优势在于:
本身就是 pandas 的模块,所以对 DataFrame 类型兼容很好
不管你列是数值型还是字符串型,都可以进行二值化编码...能够根据指令,自动生成二值化编码后的变量名
这么看来,我们找到最完美的解决方案了?