首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas数据清洗,排序,索引设置,数据选取

drop() df.drop(labels, axis=1)# 按列(axis=1),丢弃指定label的列,默认按行。。。...丢弃缺失值dropna() # 默认axi=0(行);1(列),how=‘any’ df.dropna()#每行只要有空值,就将这行删除 df.dropna(axis=1)#每列只要有空值,整列丢弃...df.dropna(how='all')# 一行中全部为NaN的,才丢弃该行 df.dropna(thresh=3)# 每行至少3个非空值才保留 缺失值填充fillna() df.fillna(0)...df.fillna({1:0,2:0.5}) #对第一列nan值赋0,第二列赋值0.5 df.fillna(method='ffill') #在列方向上以前一个值作为值赋给NaN 值替换replace(...k1列中的唯一值的行,默认保留第一行 df.drop_duplicates(['k1','k2'], take_last=True)# 保留 k1和k2 组合的唯一值的行,take_last=True

3.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

Numpy归纳整理

并根据其形状和dtype创建个全 1数组 zeros、zeros_ like 类似于ones和ones_ like, 只不过产生的是全0数组而已 empty、empty. like 创建 新数组,只分配内存空间但不填充任何值...(零)、-1 (负数) ceil 计算各元素的Ceiling值,即大于等于该值的最小整数 floor 计算各元素的floor值,即小于等于该值的最大整数 rint 将各元素值四舍五入到最接近的整数,保留...二元通用函数 函数 说明 add 将数组中对应的元素相加 subtract 从第一个数组中减去第二个数组中的元素 multiply 数组元素相乘 divide、floor_divide 除法或向下圆整除法(丢弃余数...fmax将忽略NaN minimum、fmin 元素级的最小值计算。...in1d(x,y) 得到一个表示 “x的元素是否包含 于y”的布尔型数组 setdiff1d(x, y) 集合的差,即元素在x中且不在y中 setxor1d(x, y) 集合的对称差,即存在于一个数组中但不同时存在于两个数组中的元素

1.1K20

python中drop用法_python compile函数

pandas使用NaN作为缺失数据的标记。python学习网,大量的免费python视频教程,欢迎在线学习! 使用dropna使得滤除缺失数据更加得心应手。...)的行 #axis=1:删除包含缺失值(NaN)的列 # how=‘any’:要有缺失值(NaN)出现删除 # how=‘all’:所有的值都缺失(NaN)才删除 这两个要配合使用才好。...如果是Series,则返回一个仅含非空数据和索引值的Series,默认丢弃含有缺失值的行。...xx.dropna() 对于DataFrame:data.dropna(how = ‘all’) # 传入这个参数后将只丢弃全为缺失值的那些行 data.dropna(axis = 1) # 丢弃有缺失值的列...Sex”]) # 丢弃‘Age’和‘Sex’这两列中有缺失值的行 版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。

50420

数据科学 IPython 笔记本 7.7 处理缺失数据

例如,R 语言使用每种数据类型中的保留位组合,作为表示缺失数据的标记值,而 SciDB 系统使用表示 NA 状态的额外字节,附加到每个单元。...在所有可用的 NumPy 类型中保留特定的位组合,将产生各种类型的各种操作的大量开销,甚至可能需要 NumPy 包的新分支。...无论操作如何,NaN的算术结果都是另一个NaN: 1 + np.nan # nan 0 * np.nan # nan 请注意,这意味着值的聚合是定义良好的(即,它们不会导致错误),但并不总是有用...你也可以指定how ='all',它只会丢弃全部为空值的行/列: df[3] = np.nan df 0 1 2 3 0 1.0 NaN 2 NaN 1 2.0 3.0 5 NaN 2 NaN 4.0...参数允许你为要保留的行/列指定最小数量的非空值: df.dropna(axis='rows', thresh=3) 0 1 2 3 1 2.0 3.0 5 NaN 这里删除了第一行和最后一行,因为它们只包含两个非空值

4K20

统计师的Python日记【第5天:Pandas,露两手】

如果有缺失值,比如四个数值2,3,1,NaN,那么加总的结果是2+3+1+NaN=6,也就是缺失值自动排除掉了!...解决办法是指定 skipna=False,有缺失值将不可加总: >>>df=DataFrame([[1.4, np.nan], [7.1, -4.5], [np.nan, np.nan], [0.75...二、缺失值处理 Pandas和Numpy采用NaN来表示缺失数据, ? 1. 丢弃缺失值 两种方法可以丢弃缺失值,比如第四天的日记中使用的的城市人口数据: ? 将带有缺失的行丢弃掉: ?...这个逻辑是:“一行中只要有一个格缺失,这行就要丢弃。” 那如果想要一行中全部缺失才丢弃,应该怎么办?传入 how=’all‘ 即可。 ? Chu那行被丢弃掉了。...另一种丢弃缺失值的方法是 data[data.notnull()] ,但是只能处理 数值型 数据。 ? 2.

3K70

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券