Pandas哑变量生成
哑变量又叫做虚拟变量,虚设变量或者名义变量,是人为设定的用于将分类变量引入回归模型中的方法。...哑变量一般在回归的相关模型中经常使用。在虚拟变量的设置中:表示的基础类型、肯定类型取值为1;如果是比较类型,否定类型则取值为0。
在实际的数据处理中,通过独热码one-hot来实现哑变量。...Pandas中的get_dummies函数能够实现此功能。...get_dummies使用
pandas.get_dummies(data, # 待处理数据
prefix=None, #...()使用
官网案例
enc = OneHotEncoder()
enc.fit([[0,0,3],
[1,1,0],
[0,2,1],
[1,0,2