=pd.DataFrame(data)
通过series对象创建
pd.DataFrame({'data':data,'age':[1,2,3,4])
*注意此处data是前面series创建好的有索引的对象...,没有的用nan代替
两个dataframe运算时也适用
也可以自定义缺失值
a=pd.DataFrame(np.random.randint(0,20,(2,2)),
columns=...[2,3,5],
[np.nan,4,6]])
df.dropna() 删除含有缺失值的整行数据 ,axis=1或axis='columns' 删除整列数据
df...[3] = np.nan
df.dropna(axis='columns',how='all) all表示删除全是缺失值的那行,any表示有缺失值就删除
df.dropna(axis='row...',thresh=3) 表示最少含有3个非缺失值的行才会被保留
填充缺失值:
data=pd.Series([1,np.nan,2,None,3],index=list('avcde'))