(['k1','k2'], take_last=True)# 保留 k1和k2 组合的唯一值的行,take_last=True 保留最后一行
----
排序
索引排序
# 默认axis=0,按行索引对行进行排序...中某个索引值不存在,会自动补上NaN
df2 = df1.reindex(['a','b','c','d','e'])
# fill_valuse为原先不存在的索引补上默认值,不在是NaN
df2 =...s.isin([1,2,3])
df['A'].isin([1,2,3])
df.loc[df['A'].isin([5.8,5.1])]选取列A中值为5.8,5.1的所有行组成dataframe
query...B是列范围
df.loc[1:4,['petal_length','petal_width']]
# 需求1:创建一个新的变量 test
# 如果sepal_length > 3 test = 1 否则...的每一个元素施加一个函数
func = lambda x: x+2
df.applymap(func), dataframe每个元素加2 (所有列必须数字类型)
contains
# 使用DataFrame