首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas中的.update()方法

在Pandas中,方法用于将一个DataFrame或Series对象中的值更新为另一个DataFrame或Series对象中的对应值。这个方法可以用来在原地更新数据,而不需要创建一个新的对象。

方法有几个参数,其中最重要的是参数,它指定了用来更新当前对象的另一个DataFrame或Series对象。当调用方法时,它会将对象中的值替换当前对象中相应位置的值。

下面是方法的基本语法:

DataFrame.update(other, overwrite=True, filter_func=None, errors='raise')

:要用来更新当前对象的另一个DataFrame或Series对象。

:一个布尔值,指定是否要覆盖当前对象中的值。默认为True,表示用对象中的值完全替换当前对象中的值;如果设置为False,则只会替换NaN值。

:一个可调用对象,用于筛选要更新的值。只有返回True的值才会被更新。

:指定处理错误的方式。默认为'raise',表示如果更新过程中出现错误,将引发异常;如果设置为'ignore',则会忽略错误并继续执行。

需要注意的是,方法会就地修改当前对象,而不会返回一个新的对象。这与许多Pandas方法的行为不同,因为它们通常会返回一个新的对象。因此在使用方法之前,请确保对数据进行了适当的备份或者确保没有破坏原始数据的需求。

让我们从需要更新开始,我们的数据如下:

我们想要将下面的数据匹配到原始数据上:

如果直接使用,看看结果是什么:

df.update(df1)

df

所有单元格都将被替换,除非我们的新DF有空,update()方法内联地改变了原始的数据,而不是创建副本。

overwrite参数

除了空值所有单元格都被替换了,这时因为.update()只是假设新数据更相关。如果只想替换缺失的值,请可以设置参数' overwrite = False '

df.update(df1,overwrite=False)

df

filter_func参数

也可以通过使用' filter_func '参数来更新除null以外的单元格。例如只替换偶数的值。

df.update(df1,filter_func=lambda x : x%2==0)

df

可以看到只更新了符合判断条件的值。

方法可以方便的将一个DataFrame或Series对象中的值更新为另一个DataFrame或Series对象中的对应值,但是我们却很少用到它。所以在处理缺失或者过期数据更新时,pandas中的update方法是一个很有用的工具。但是需要注意的是,在使用方法之前,需要对数据进行了适当的备份或者确保没有破坏原始数据的需求,因为他会直接修改我们的DF。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OftjUJVXZJvB1q-tqjeAHR5g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券