专栏首页SnailTyanpandas的基本用法——处理缺失数据

pandas的基本用法——处理缺失数据

本文主要是关于pandas的一些基本用法。

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import pandas as pd
import numpy as np


# Test 1
# 定义数据
dates = pd.date_range('20170101', periods = 6)
df = pd.DataFrame(np.arange(24).reshape((6, 4)), index = dates, columns = ['A', 'B', 'C', 'D'])

# 假设缺少数据
df.iloc[1, 1] = np.nan
df.iloc[2, 2] = np.nan
print df

# Test 1 result
             A     B     C   D
2017-01-01   0   1.0   2.0   3
2017-01-02   4   NaN   6.0   7
2017-01-03   8   9.0   NaN  11
2017-01-04  12  13.0  14.0  15
2017-01-05  16  17.0  18.0  19
2017-01-06  20  21.0  22.0  23

# Test 2
# 按行或列来舍弃数据, how = any or all, any是默认值
print df.dropna(axis = 0, how = 'any')

# 填充数据
print df.fillna(value = 0)

# 判断是否缺失数据
print df.isnull()

# 判断是否存在缺失数据的情况
print np.any(df.isnull() == True)

# Test 2 result
             A     B     C   D
2017-01-01   0   1.0   2.0   3
2017-01-04  12  13.0  14.0  15
2017-01-05  16  17.0  18.0  19
2017-01-06  20  21.0  22.0  23

             A     B     C   D
2017-01-01   0   1.0   2.0   3
2017-01-02   4   0.0   6.0   7
2017-01-03   8   9.0   0.0  11
2017-01-04  12  13.0  14.0  15
2017-01-05  16  17.0  18.0  19
2017-01-06  20  21.0  22.0  23

                A      B      C      D
2017-01-01  False  False  False  False
2017-01-02  False   True  False  False
2017-01-03  False  False   True  False
2017-01-04  False  False  False  False
2017-01-05  False  False  False  False
2017-01-06  False  False  False  False

True

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pandas的基本用法(三)——设置数据

    Tyan
  • pandas的基本用法(二)——选择数据

    Tyan
  • Linux的mktemp命令

    Linux系统有特殊的目录,专供临时文件使用。Linux使用/tmp目录来存放不需要永久保留的文件。mktemp命令专门用来创建临时文件,并且其创建的临时文件是...

    Tyan
  • LeetCode 287. Find the Duplicate Number

    一道好题目。 发现数组里重复的数字是什么,不借助额外的数据结构。数组里的数字范围是1-n,数组的个数是n+1,所以一定存在重复的情况。重复的个数至少是1。如果...

    ShenduCC
  • QQ上线“高能舞室”背后:内容年轻化+技术轻量化

    文 / 企鹅生态,转载请注明。 长时间关注年轻用户聚集的社区的话就一定会发现,舞蹈是今天年轻用户最喜欢的数字内容形式之一。从B站宅舞到抖音短视频,各种基于舞蹈的...

    企鹅号小编
  • 仿12306查询火车票功能

    首先感谢http://www.zuidaima.com/share/1861712958622720.html对我的帮助,我在此基础上修改了页面的显示, 先上效...

    xiangzhihong
  • win10 uwp 使用 LayoutTransformer

    如果需要使用旋转,那么很容易把图片旋转的布局被裁剪。如果需要旋转的控件还在指定的 Grid 内,就需要使用布局的旋转。本文告诉大家如何使用 LayoutTran...

    林德熙
  • 蓝牙遥控平衡小车的制作

    出于业余爱好,以及学习自动化控制PID理论,经过多种选择后决定制作平衡车进行实际操练。刚开始试着用单纯的裸机,完成直立控制,然后慢慢的又增加了屏幕显示,用于参数...

    刘盼
  • python实现一个简单的3389读取工具(1)

    lonelyvaf
  • 图片转二进制流并通过HTTP上传到静态文件服务器

    type设置为MediaType.parse("application/json; charset=utf-8")

    麦克劳林

扫码关注云+社区

领取腾讯云代金券