pd.DataFrame(np.random.randn(4, 3))
df.iloc[:2, 1] = np.nan
df.iloc[:2, 2] = np.nan
print(round(df, 2)) #保留两位数字...round(df.fillna(0), 2) #缺失值赋值为0,保留两位数字
-----结果-----
df:
0 1 2
0 0.35 NaN NaN
1 -1.18...方法:
df = pd.DataFrame({'k1':['one', 'two']*3+['two'], 'k2':[1, 1, 2, 3, 3, 4, 4]})
print(df.duplicated...,传入参数last="last"将会返回最后一个:
print(df.drop_duplicates(['k1'], keep = 'last')) #保留最后一个值
-----结果-----...今天的内容就介绍到这里,比较重要的内容有补全缺失值和替代值,下一篇将简单介绍重命名轴索引和检测过滤异常值。