fill填充
缺失值处理:
常用标签nan(not a number)
val = np.array([1,np.nan,3,4])
val.sum,max,min 会将nan的影响算进去... np.nansum(val) ,nanmax,nanmin 忽略nan的影响
data= pd.Series([1,np.nan,'hello',None])
发现缺失值:
data.isnull...',thresh=3) 表示最少含有3个非缺失值的行才会被保留
填充缺失值:
data=pd.Series([1,np.nan,2,None,3],index=list('avcde'))
...data.fillna(0) 缺失值用0填充
data.fillna(method='ffill') 用缺失值前面的有效值填充,bfill用后面的有效值填充
data.fillna(method...='ffill',axis=1) 每行的前面有效值填充
如果缺失值前面没有值,那么仍然是缺失值