display.max_rows', 100,'display.max_columns', 100,"display.max_colwidth",1000,'display.width',1000)
【Step 2:删除无效列与填充空值...】
数据的许多列包含大量的空值和单一数据,当这些数据超过一定量时,对模型来说是无效的,因此先将这一部分数据进行删除。...("false", np.nan).replace("未知", np.nan)
# 空值填充
mean_fill_col = ['排量(L)', '最高车速(km/h)', '官方0-100km/h加速...', '自动头灯', '后视镜加热', '后雨刷', '后座出风口',
'4S店保养', '原始购车/过户发票', '车辆购置税完税证明']
# 异常值替换及空值填充..., 0)
data[c].fillna(0, inplace=True)
【Step 6:One-Hot型数据处理】
当一列值可以被分成多个类别时,我们可以将数据处理成独热编码(One-Hot)