Pandas切片
Pandas数据访问方式包括:df[] ,.at,.iat,.loc,.iloc(之前有ix方法,pandas1.0之后已被移除)
df[] :直接索引
at/iat:通过标签或行号获取某个数值的具体位置...loc:通过标签选取数据,即通过index和columns的值进行选取。loc方法有两个参数,按顺序控制行列选取,范围包括start和end。...错误示范
新建一个DataFrame
df = pd.DataFrame(
{'x':[1,5,4,3,4,5],
'y':[.1,.5,.4,.3,.4,.5],
'w':[11,15,14,13,14,15...这里我们就遇到了所谓的“链接索引”,具体原因是使用了两个索引器,例如:df[][]
df[df['x']>3] 导致Pandas创建原始DataFrame的单独副本
df[df['x']>3]['y']...实际上有两个要点,可以使我们在使用切片和数据操作时免受任何有害影响:
避免链接索引,始终选择.loc/ .iloc(或.at/ .iat)方法;
使用copy() 创建独立的对象,并保护原始资源免遭不当操纵