Pandas-5.基本操作

1. Series基本功能

以如下Series作为例子

import pandas as pd
import numpy as np
s = pd.Series(np.random.randn(4))
  • axes:返回行轴标签列表
print(s.axes)
# [RangeIndex(start=0, stop=4, step=1)]
# 这是[0, 5)的紧凑格式即[0,1,2,3,4]
  • empty:返回对象是否为空
print(s.empty)
# False
  • dtype:返回对象数据类型
print(s.dtype)
# float64
  • ndim:返回底层数据的维数,默认定义:1
print(s.ndim)
# 1
  • size:返回元素数据数
print(s.size)
# 4
  • values:将Series作为ndarray返回
s.values
# array([ 0.86667361, -1.05757677, -0.26174514, -0.49398881])
  • head():返回前n行
print(s.head(2))
# 0    0.866674
# 1   -1.057577
# dtype: float64
  • tail():返回最后n行
print(s.tail(2))
# 2   -0.261745
# 3   -0.493989
# dtype: float64

2. DataFrame的基本功能

以以下代码作为例子

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Minsu','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
#Create a DataFrame
df = pd.DataFrame(d)
  • T:转置
print(df.T)
#            0      1      2     3      4      5     6
# Name     Tom  James  Ricky   Vin  Steve  Minsu  Jack
# Age       25     26     25    23     30     29    23
# Rating  4.23   3.24   3.98  2.56    3.2    4.6   3.8
  • axes:返回一列,行轴标签和列轴标签作为唯一的成员
print(df.axes)
# [RangeIndex(start=0, stop=7, step=1), Index(['Name', 'Age', 'Rating'], dtype='object')]
  • dtypes:返回对象中的数据类型
print(df.dtypes)
# Name       object
# Age         int64
# Rating    float64
# dtype: object
  • empty:返回对象是否为空
print(df.empty)
# False
  • ndim:轴/数组维度大小
print(df.ndim)
# 2
  • shape:返回标识DataFrame的维度的元组
print(df.shape)
# (7, 3)
  • size:元素数
print(df.size)
# 21
  • values:对象的Numpy表示
print(df.values)
'''
[['Tom' 25 4.23]
 ['James' 26 3.24]
 ['Ricky' 25 3.98]
 ['Vin' 23 2.56]
 ['Steve' 30 3.2]
 ['Minsu' 29 4.6]
 ['Jack' 23 3.8]]
'''
  • head():开头前n行
print(df.head(2))
'''
    Name  Age  Rating
0    Tom   25    4.23
1  James   26    3.24
'''
  • tail():最后前n行
print(df.tail(2))
'''
    Name  Age  Rating
5  Minsu   29     4.6
6   Jack   23     3.8
'''

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Pandas-17.缺失数据

    悠扬前奏
  • Pandas-3. DataFrame

    Series组成的字典可以作为参数来创建DataFrame。其索引是所有Series的索引的并集。 例子:

    悠扬前奏
  • Pandas-27.文件读取

    read_csv和readtable()可以将文件中的内容转换为DataFrame对象:

    悠扬前奏
  • Spark2.4.0源码分析之WorldCount 事件循环处理器(三)

    thinktothings
  • 【Python环境】Python数据分析入门

    本文来分享一下如何通过Python来开始数据分析。 具体内容如下: 数据导入 导入本地的或者web端的CSV文件; 数据变换; 数据统计描述; 假设检验 单样本...

    陆勤_数据人网
  • Pandas基础命令速查表

    pd.set_option('display.height', 1000) pd.set_option('display.max_rows', 500) p...

    光点神奇
  • 3 个适合新人上手的Python项目

    人生苦短,我用Python!废话不多说,今天给大家分享三个极实用的Python爬虫案例。

    用户2769421
  • Scrum 实操流程

    Scrum 是用于开发、交付和持续支持复杂产品的一个框架,是一个增量的、迭代的开发过程。

    公众号php_pachong
  • 学完 Python ,我需要编个游戏露两手

    作为一名拥有十余年程序设计教学经验的老师,我清楚地记得,当告诉学生们课程任务有俄罗斯方块游戏开发的时候,部分同学在课堂上热切地喊出“好耶”,部分同学鼓起掌来,大...

    CSDN技术头条
  • linux环境常用的性能监控和协助开发调试工具

    linux有诸多优秀的工具帮助我们分析服务器各项性能指标和协助开发调试工作。下面只列举比较基础的命令,且一般是集成在linux环境中而不需再次安装的...

    s1mba

扫码关注云+社区

领取腾讯云代金券