,iloc与series对象中的用法相同
data.loc[:'lin',:'age']
data.iloc[:3,:2]
ix混合使用,不常用
data.ix[:3,:'age']
与掩码和花哨索引结合使用...data.loc[data.age>18,['name','age']]
更新数据
data[0,1]= 20
numpy通用函数pandas也适用
当用两个series对象创建dataframe对象时...,会取两个对象的并集,没有的用nan代替
两个dataframe运算时也适用
也可以自定义缺失值
a=pd.DataFrame(np.random.randint(0,20,(2,2)),
...fill填充
缺失值处理:
常用标签nan(not a number)
val = np.array([1,np.nan,3,4])
val.sum,max,min 会将nan的影响算进去... np.nansum(val) ,nanmax,nanmin 忽略nan的影响
data= pd.Series([1,np.nan,'hello',None])
发现缺失值:
data.isnull