print(c, data[c].isin(["标配"]).sum())
data.drop([c], axis=1, inplace=True)
# 删除 “售价” 和 “排量” 为空的行...', '最大功率(kW)',
'最大扭矩(N·m)'
]
numerical_df = data[numerical_col]
# 将非数值型数据替换为...# 处理日期型数据
date_col = ['商业险过期日期','交强险过期日期', '注册日期', '出厂日期', '车船税过期日期']
data['数据获取日期'] = '2020-07-25'...类似这种的数据我们称为"二值型"数据,可以将其转化为0-1的形式。..., 0)
data[c].fillna(0, inplace=True)
【Step 6:One-Hot型数据处理】
当一列值可以被分成多个类别时,我们可以将数据处理成独热编码(One-Hot)