前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python+pandas填充缺失值的几种方法

Python+pandas填充缺失值的几种方法

作者头像
Python小屋屋主
发布2019-07-08 14:38:43
9.9K0
发布2019-07-08 14:38:43
举报
文章被收录于专栏:Python小屋Python小屋

封面图片:《Python程序设计基础(第2版)》,ISBN:9787302490562,董付国,清华大学出版社

图书详情:https://item.jd.com/12319738.html

好消息:智慧树网APP“知到”中搜索“董付国”可以免费观看《Python程序设计基础(第2版)》配套的32节360分钟视频

==============

由于人为失误或机器故障,可能会导致某些数据丢失。在数据分析时应注意检查有没有缺失的数据,如果有则将其删除或替换为特定的值,以减小对最终数据分析结果的影响。

DataFrame结构支持使用dropna()方法丢弃带有缺失值的数据行,或者使用fillna()方法对缺失值进行批量替换,也可以使用loc()、iloc()方法直接对符合条件的数据进行替换。

dropna()方法的语法为:

dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

其中,参数how='any'时表示只要某行包含缺失值就丢弃,how='all'时表示某行全部为缺失值才丢弃;参数thresh用来指定保留包含几个非缺失值数据的行;参数subset用来指定在判断缺失值时只考虑哪些列。

用于填充缺失值的fillna()方法的语法为:

fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

其中,参数value用来指定要替换的值,可以是标量、字典、Series或DataFrame;参数method用来指定填充缺失值的方式,值为'pad'或'ffill'时表示使用扫描过程中遇到的最后一个有效值一直填充到下一个有效值,值为'backfill'或'bfill'时表示使用缺失值之后遇到的第一个有效值填充前面遇到的所有连续缺失值;参数limit用来指定设置了参数method时最多填充多少个连续的缺失值;参数inplace=True时表示原地替换。

本文重点演示fillna()方法的用法。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python小屋 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档