:
(1)确定X中唯一值的个数K,将唯一值作为关键字,即Key=[x1,x2,…,xk]
(2)生成k个数字作为键值,即Value=[0,1,2,…,k]
(3)每一个唯一的类别型元素对应着一个数字,即键值对...(key))] # 键值
Dict = dict(zip(key, value)) # 字典,即键值对
for i in range(len(key)):
for j...=[1,1,1,…,k]
(3)每一个唯一的类别型元素对应着一个数字,即键值对dict={key1:0, key2:1,…, keyk:k}
(4)创建一个空的数组v=V(n维 x k维)=np.zeros...() # (1)
value = np.ones(len(key)) # (2)
Dict = dict(zip(key, value)) # (3)
v = np.zeros...除了使用sklearn中的OneHotEncoder类得到哑特征,推荐大家使用Pandas中的get_dummies方法来创建哑特征,get_dummies默认会对DataFrame中所有字符串类型的列进行独热编码