pandas 使用指南

备案控制台

登录注册

在线学习中心课程pandas 使用指南

10分钟

分组1

1. 分组运算的过程为：拆分-应用-合并

拆分阶段：Series/DataFrame等数据根据你提供的一个或者多个键，被拆分为多组
应用阶段：根据你提供的一个函数应用到这些分组上
合并阶段：将函数的执行结果合并到最终结果中

2. 分组中有两种数据：源数据（被分组的对象），分组数据（用于划分源数据的）。

源数据每一行(axis=0) 对应于分组数据中的一个元素。分组数据中每一个唯一值对应于一个分组。
当分组数据也在源数据中时，可以直接通过指定列名来指定分组数据（值相同的为同一组）。

3. .groupby()方法是分组方法：

  Series/DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, 
  group_keys=True, squeeze=False, **kwargs)

如果axis=1，则index label替换成column label
axis：指定沿着哪个轴分组。可以为0/'index'，表示沿着 0轴。可以为1/'columns'，表示沿着 1轴
level：一个整数、level name或者其序列。如果axis是个MultiIndex，则在指定级别上的索引来分组
as_index：一个布尔值。如果为True，则将group label作为输出的index。如果为False，则输出是SQL风格的分组（此时分组的key作为一列，而不是作为index）。Series中，该参数必须为True。
sort：一个布尔值。如果为True，则对分组的键进行排序。
group_keys：一个布尔值。如果为True，且调用了函数来决定分组，则添加分组键来区分不同的数据（否则你不知道每一行数据都对应于哪里）
squeeze：一个布尔值。如果为True，则尽可能的缩减结果的类型。
该函数返回一个GroupBy对象。

直播支持申请

目录

评价

推荐

1. 基本数据结构

基本数据结构

Series

Index1

Index2

MultiIndex

DataFrame1

DataFrame2

2. 内部数据结构

Index

MultiIndex

Seris

DataFrame

3. 下标存取

[ ] 操作符1

[ ] 操作符2

loc/iloc/ix 存取器1

loc/iloc/ix 存取器2

at/iat 存取器1

at/iat 存取器2

query 方法

多级索引

整数 label

4. 运算

数值运算

排序1

排序2

统计1

统计2

5. 变换

索引和轴的变换1

索引和轴的变换2

合并数据1

合并数据2

索引旋转

6. 数据清洗

移除重复数据

apply1

apply2

缺失数据1

缺失数据2

离散化

7. 字符串操作

字符串操作

8. 聚合与分组

分组1

分组2

GroupBy对象1

GroupBy对象2

分组级运算

透视表和交叉表1

透视表和交叉表2

9. 时间序列

时间序列

Python 中的时间

时区

time 模块

datetime 模块1

datetime 模块2

时间点 Timestamp

DateOffset

Timedelta

时间段 Period

pands

.to_period(freq)

.asfreq()

DatetimeIndex

pandas.date_range()

Series

DatetimeIndex的方法

PeriodIndex

pandas.period_range()

PeriodIndex的方法

shift()

resampling

resample