首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas 之 缺失值的处理

什么是缺失值? (控制) 那么,到底什么是缺失值呢? 直观上理解,缺失值表示的是‘缺失的数据’ 缺失值 导致的原因是什么呢? 1) 可能是由于数据不全所以导致数据缺失 2) 可能是误操作导致数据缺失 3) 亦或者人为地造成数据缺失。 什么是缺失值? (控制) 那么,到底什么是缺失值呢? 直观上理解,缺失值表示的是‘缺失的数据’ 缺失值 导致的原因是什么呢? 1) 可能是由于数据不全所以导致数据缺失 2) 可能是误操作导致数据缺失 3) 亦或者人为地造成数据缺失。 #导入相关库 import numpy as np import pandas as pd index =pd.Index(data=["A","B","C","D","风"],name="name") data = { "age":[18,10,np.nan,22,25], "city":["Beijing","Shanghai","guangzhou","shenzhen","XiAn"], "Sex":[None,"male","feamle",np.nan,"feamle"], "birth":["1990-10-10",None,np.nan,"1998-01-01","2020-10-20"] } user_info = pd.DataFrame(data=data,index=index) user_info age city Sex birth name A 18.0 Beijing None 1990-10-10 B 10.0 Shanghai male None C NaN guangzhou feamle NaN D 22.0 shenzhen NaN 1998-01-01 风 25.0 XiAn feamle 2020-10-20 #将出生日期转化为时间戳 user_info["birth"] = pd.to_datetime(user_info.birth) user_info age city Sex birth name A 18.0 Beijing None 1990-10-10 B 10.0 Shanghai male NaT C NaN guangzhou feamle NaT D 22.0 shenzhen NaN 1998-01-01 风 25.0 XiAn feamle 2020-10-20 # 可以看到用户 D 的性别为 NAN, # 再pandas 眼中 这些都属于 缺失值 # 可以使用 isnull() 或者 notnull()方法来操作。 user_info.isnull() age city Sex birth name A False False True False B False False False True C True False False True D False False True False 风 False False False False user_info.notnull() age city Sex birth name A True True False True B True True True False C False True True False D True True False True 风 True True True True #假如我想过滤掉 性别为空的 用户呢 user_info user_info[user_info.Sex.notnull()] age city Sex birth name B 10.0 Shanghai male NaT C NaN guangzhou feamle NaT 风 25.0 XiAn feamle 2020-10-20 # 缺失值处理方案之-丢弃缺失值 #dropna 方法 user_info.Sex.dropn

02

Pandas数据处理1、DataFrame删除NaN空值(dropna各种属性值控制超全)

这个女娃娃是否有一种初恋的感觉呢,但是她很明显不是一个真正意义存在的图片,我们需要很复杂的推算以及各种炼丹模型生成的AI图片,我自己认为难度系数很高,我仅仅用了64个文字形容词就生成了她,很有初恋的感觉,符合审美观,对于计算机来说她是一组数字,可是这个数字是怎么推断出来的就是很复杂了,我们在模型训练中可以看到基本上到处都存在着Pandas处理,在最基础的OpenCV中也会有很多的Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个Pandas文章,每个人的写法都不同,但是都是适合自己理解的方案,我是用于教学的,故而我相信我的文章更适合新晋的程序员们学习,期望能节约大家的事件从而更好的将精力放到真正去实现某种功能上去。本专栏会更很多,只要我测试出新的用法就会添加,持续更新迭代,可以当做【Pandas字典】来使用,期待您的三连支持与帮助。

02
领券