有两种数据类型Series和DataFrame
Series由一组数据(numpy的ndarray)和一组与之相对应的标签构成
DataFrame表格行的数据结构,包含一组有序的列
Series
何为...ser02=Series(ser01,index=['n ','m','j','q'])
pd.isnull(ser02)
#过滤掉np.nan的值
ser02[pd.notnull(ser02)]
自动对齐...#自动对齐,把相同的index相加
ser03=Series([1,2,3,4],index=['n','h','m','t'])
ser02+ser03
DataFrame
何为DataFrame...注意和数学统计里面默认计算的列不一样
df04.dropna(how="all")
#替换缺失值
df04.fillna(0)
df04.fillna({0:1,1:2,2:3})
数学统计
常见的方法如count...12,13,14,15,13,13,12,11,14])
df3.unique()
df3.value_counts()
df3[df3.isin([14,15])]#成员资格
层次索引
索引可以大于一维,