首页
学习
活动
专区
工具
TVP
发布

A2Data

专栏作者
373
文章
384015
阅读量
30
订阅数
不会这5个Excel函数,不好意思说会做数据分析
从小到大,我们每一个人都深陷各种各样的排名,考试成绩排名、KPI绩效排名、业绩排名、市场份额排名、满意度排名……各种“被排名”关系着家长、老师、领导、同事对我们的态度。
DataScience
2020-11-06
3.9K0
Pandas 之 缺失值的处理
什么是缺失值? (控制) 那么,到底什么是缺失值呢? 直观上理解,缺失值表示的是‘缺失的数据’ 缺失值 导致的原因是什么呢? 1) 可能是由于数据不全所以导致数据缺失 2) 可能是误操作导致数据缺失 3) 亦或者人为地造成数据缺失。 什么是缺失值? (控制) 那么,到底什么是缺失值呢? 直观上理解,缺失值表示的是‘缺失的数据’ 缺失值 导致的原因是什么呢? 1) 可能是由于数据不全所以导致数据缺失 2) 可能是误操作导致数据缺失 3) 亦或者人为地造成数据缺失。 #导入相关库 import numpy as np import pandas as pd index =pd.Index(data=["A","B","C","D","风"],name="name") data = { "age":[18,10,np.nan,22,25], "city":["Beijing","Shanghai","guangzhou","shenzhen","XiAn"], "Sex":[None,"male","feamle",np.nan,"feamle"], "birth":["1990-10-10",None,np.nan,"1998-01-01","2020-10-20"] } user_info = pd.DataFrame(data=data,index=index) user_info age city Sex birth name A 18.0 Beijing None 1990-10-10 B 10.0 Shanghai male None C NaN guangzhou feamle NaN D 22.0 shenzhen NaN 1998-01-01 风 25.0 XiAn feamle 2020-10-20 #将出生日期转化为时间戳 user_info["birth"] = pd.to_datetime(user_info.birth) user_info age city Sex birth name A 18.0 Beijing None 1990-10-10 B 10.0 Shanghai male NaT C NaN guangzhou feamle NaT D 22.0 shenzhen NaN 1998-01-01 风 25.0 XiAn feamle 2020-10-20 # 可以看到用户 D 的性别为 NAN, # 再pandas 眼中 这些都属于 缺失值 # 可以使用 isnull() 或者 notnull()方法来操作。 user_info.isnull() age city Sex birth name A False False True False B False False False True C True False False True D False False True False 风 False False False False user_info.notnull() age city Sex birth name A True True False True B True True True False C False True True False D True True False True 风 True True True True #假如我想过滤掉 性别为空的 用户呢 user_info user_info[user_info.Sex.notnull()] age city Sex birth name B 10.0 Shanghai male NaT C NaN guangzhou feamle NaT 风 25.0 XiAn feamle 2020-10-20 # 缺失值处理方案之-丢弃缺失值 #dropna 方法 user_info.Sex.dropn
DataScience
2019-12-31
1.5K0
VMware虚拟机NAT模式上网设置
很多初学者不知道如何正确设置,VMware虚拟机与主机互联,在NAT模式下实现上网。这里详细介绍其设置过程,讲解详细而易懂实用,希望能帮到需要的人。
DataScience
2019-12-30
3.9K1
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档