专栏首页SnailTyanpandas的基本用法(二)——选择数据

pandas的基本用法(二)——选择数据

本文主要是关于pandas的一些基本用法。

#!/usr/bin/env python
# _*_ coding: utf-8 _*_

import pandas as pd
import numpy as np


# Test 1
# 定义数据
dates = pd.date_range('20170101', periods = 6)
print dates

df = pd.DataFrame(np.arange(24).reshape((6, 4)), index = dates, columns = ['A', 'B', 'C', 'D'])
print df


# Test 1 result
DatetimeIndex(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
               '2017-01-05', '2017-01-06'],
              dtype='datetime64[ns]', freq='D')

             A   B   C   D
2017-01-01   0   1   2   3
2017-01-02   4   5   6   7
2017-01-03   8   9  10  11
2017-01-04  12  13  14  15
2017-01-05  16  17  18  19
2017-01-06  20  21  22  23

# Test 2
# 选择第一列数据
print df['A']
print df.A

# 选择前三行数据
print df[0:3]
print df['20170101':'20170103']

# 根据标签选择
print df.loc['20170101']

# 选择所有行, 特定列
print df.loc[:, ['A', 'B']]

# 选择特定行, 特定列
print df.loc['20170102', ['A', 'B']]

# Test 2 result
2017-01-01     0
2017-01-02     4
2017-01-03     8
2017-01-04    12
2017-01-05    16
2017-01-06    20
Freq: D, Name: A, dtype: int64
2017-01-01     0
2017-01-02     4
2017-01-03     8
2017-01-04    12
2017-01-05    16
2017-01-06    20
Freq: D, Name: A, dtype: int64

            A  B   C   D
2017-01-01  0  1   2   3
2017-01-02  4  5   6   7
2017-01-03  8  9  10  11
            A  B   C   D
2017-01-01  0  1   2   3
2017-01-02  4  5   6   7
2017-01-03  8  9  10  11

A    0
B    1
C    2
D    3
Name: 2017-01-01 00:00:00, dtype: int64

             A   B
2017-01-01   0   1
2017-01-02   4   5
2017-01-03   8   9
2017-01-04  12  13
2017-01-05  16  17
2017-01-06  20  21

A    4
B    5
Name: 2017-01-02 00:00:00, dtype: int64

# Test 3
# 根据行列来选择
print df.iloc[3:5, 1:3]

# 不连续的选择
print df.iloc[[1, 3, 5], 2:4]

# 混合选择
print df.ix[[1, 3, 5], ['A', 'B']]

# 对比选择
print df[df.A > 4]

# Test 3 result
             B   C
2017-01-04  13  14
2017-01-05  17  18

             C   D
2017-01-02   6   7
2017-01-04  14  15
2017-01-06  22  23

             A   B
2017-01-02   4   5
2017-01-04  12  13
2017-01-06  20  21

             A   B   C   D
2017-01-03   8   9  10  11
2017-01-04  12  13  14  15
2017-01-05  16  17  18  19
2017-01-06  20  21  22  23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • pandas的基本用法——处理缺失数据

    Tyan
  • Pandas的基本用法(三)——设置数据

    Tyan
  • nohup python缓存问题

    版权声明:博客文章都是作者辛苦整理的,转载请注明出处,谢谢! https://blog.csdn....

    Tyan
  • 借网站日记分析~普及一下Pandas基础

    对网站日记分析其实比较常见,今天模拟演示一下一些应用场景,也顺便说说Pandas,图示部分也简单分析了下

    逸鹏
  • 【支付系统设计从0到1】深度解析支付宝产品架构

    支付宝作为最老牌的支付机构,其支付系统的架构和使用的技术是很值得我们在设计与实现支付系统时作为参考的,这篇文章为大家深度解析支付宝的产品架构。

    金融民工小曾
  • Pandas的基本用法(三)——设置数据

    Tyan
  • Pandas-27.文件读取

    read_csv和readtable()可以将文件中的内容转换为DataFrame对象:

    悠扬前奏
  • Docker实现容器具有固定IP

    在搭建一些集群软件的时候,组件和组件之间需要进行网络通信,这个时候如果每次重启IP都发生变化会很不方便,因此希望能够将容器的IP固定下来,这也是可以实现的,具体...

    大江小浪
  • 横扫13项中文NLP记录,中文字型深度学习模型Glyce问世!

    [ 导读 ]香侬科技近期提出 Glyce,首次在深度学习的框架下使用中文字形信息(Glyph),横扫 13 项中文自然语言任务记录,其中包括:(1) 字级别语言...

    数据派THU
  • 响铃:社交型流量平台,为何线上平台都扎堆去线下造节

    先解释一下概念:社交型流量平台,指的是底层以社交为流量源的平台,比如微博、直播、短视频、交友社区等。近两年,这些社交型流量平台渐渐流行起了线下造节。

    曾响铃

扫码关注云+社区

领取腾讯云代金券