首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas 2.2 中文官方教程和指南(十二·一)

在本节中,我们展示“层次化”索引的确切含义以及它如何与上述和之前章节中描述的所有 pandas 索引功能集成。...稍后,在讨论分组和数据透视和重塑时,我们展示非平凡的应用程序,以说明它如何帮助构建数据进行分析。 查看食谱以获取一些高级策略。...这可能会在使用numpy的ufuncs(如numpy.logical_and)时造成一些问题。 请参阅GH 2388以获取详细的讨论。...在本节中,我们展示“层次化”索引的确切含义以及它如何与上述和之前章节中描述的所有 pandas 索引功能集成。...稍后,在讨论分组和数据透视和重塑时,我们展示非平凡的应用程序,以说明它如何帮助结构化数据进行分析。 请参阅食谱以获取一些高级策略。

12910

pandas系列6-重塑reshape

重新排列表格型数据的基础运算称之为重塑reshape或者轴向旋转pivot stack:数据的列旋转成行,AB由列属性变成行索引 unstack:数据的行旋转成列,AB由行索引变成列属性 重点知识...stack和unstack的用法 如何实现行和列的位置互换 ?...层次化索引 MultiIndex 数据分散在不同的文件或者数据库中 层次化索引在⼀个轴上拥有多个(两个以上)索引级别 低维度形式处理高维度数据 import pandas as pd import numpy...(tuples, names=['first', 'second']) # 错层次索引如何创建 # index = pd.MultiIndex.from_tuples(tuples, names=['...pivot 本质 DF的pivot本质上就是set_index先创建层次化索引,再利用unstack进行重塑Pandas透视表详解 ?

66610
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas图鉴(四):MultiIndex

它建立在NumPy库的基础上,借用了它的许多概念和语法约定,所以如果你对NumPy很熟悉,你会发现Pandas是一个相当熟悉的工具。...即使你从未听说过NumPyPandas也可以让你在几乎没有编程背景的情况下轻松拿捏数据分析问题。...你也可以在事后用append=True现有的级别追加到MultiIndex中,正如你在下图中看到的那样: 其实典型的是Pandas,当有一些具有某种属性的对象时,特别是当它们随着时间的推移而演变时...列增加层次的一个常见方法是现有的层次从索引中 "unstacking"出来: tack, unstack Pandas的stack与NumPy的stack非常不同。...多索引DataFrame读入和写入磁盘 Pandas可以以完全自动化的方式一个带有MultiIndex的DataFrame写入CSV文件:df.to_csv('df.csv')。

42720

盘一盘 Python 系列 4 - Pandas (上)

是 Python 解决数据分析而创建的,详情看官网 (https://pandas.pydata.org/)。...import pandas as pd Pandas 里面的数据结构是「多维数据表」,学习它可以类比这 NumPy 里的「多维数组」。...和学习 numpy 一样,学习 pandas 还是遵循的 Python 里「万物皆对象」的原则,既然把数据表当对象,我们就按着数据表的创建、数据表的存载、数据表的获取、数据表的合并和连接、数据表的重塑和透视...( midx ) df 首先用 concat() 函数 (下帖的内容) df1 和 df2 连接起来;再用「列表解析法」生成 midx,它是一个元组的列表,c 是股票代码,d 是日期;最后放入 MultiIndex.from_tuples...让我们看看 Series 的多层 index 是如何表示的 data.index MultiIndex(levels=[['2019-04-01', '2019-04-02', '2019-04-03'

6.1K52

Pandas 2.2 中文官方教程和指南(七)

涵盖了 NumPypandas 的基本操作,4 种主要的数据操作方法(包括索引、分组、重塑和连接)以及 4 种主要的数据类型(包括缺失数据、字符串数据、分类数据和时间序列数据)。...通过 Hernan Rojas 学习熊猫 新熊猫用户准备的一套课程:bitbucket.org/hrojas/learn-pandas 用 Python 进行实用数据分析 这个指南是一个介绍如何使用...涵盖了 NumPypandas 的基本操作,4 种主要数据操作方法(包括索引、分组、重塑和连接)以及 4 种主要数据类型(包括缺失数据、字符串数据、分类数据和时间序列数据)。...您可以在食谱中查看复杂的示例。...当您调用 DataFrame.to_numpy(),pandas 找到可以容纳 DataFrame 中 所有 dtypes 的 NumPy dtype。

26600

Pandas图鉴(三):DataFrames

MultiIndex 我们拆分成四个部分,依次呈现~建议关注和星标@公众号:数据STUDIO,精彩内容等你来~ Part 3....df.info()总结了所有相关信息 还可以一个或几个列设置索引。这个过程如下所示: 索引在Pandas中有很多用途: 它使通过索引列的查询更快; 算术运算、堆叠、连接是按索引排列的;等等。...下一个选择是用NumPy向量的dict或二维NumPy数组构造一个DataFrame: 请注意第二种情况下,人口值是如何被转换为浮点数的。实际上,这发生在构建NumPy数组的早期。...你不能通过标签访问行,不能通过位置索引访问不相干的行,你甚至不能引用单个单元格,因为df['x', 'y']是MultiIndex准备的!...通过MultiIndex进行堆叠 如果行和列的标签都重合,concat可以做一个相当于垂直堆叠的MultiIndex(像NumPy的dstack): 如果行和/或列部分重叠,Pandas将相应地对齐名称

35920

NumPy 1.26 中文官方指南(二)

如何导入 NumPy 要访问 NumPy 及其函数,请在你的 Python 代码中这样导入: import numpy as np 我们导入名称缩短np,以提高使用 NumPy 的代码的可读性。...使用 np.newaxis 会在使用一次后数组的维度增加一维。这意味着1D 数组将成为2D 数组,2D 数组将成为3D 数组,依此类推。...如果对 NumPy 不熟悉,可以从数组的值中创建一个 Pandas 数据框,然后使用 Pandas 数据框写入 CSV 文件。...如何导入 NumPy 要访问 NumPy 及其函数,请在你的 Python 代码中像这样导入它: import numpy as np 我们导入的名称缩短np,以提高使用 NumPy 的代码的可读性...这意味着一个1D数组变成一个2D数组,一个2D数组变成一个3D数组,依此类推。

15110

ApacheCN 数据科学译文集 20211109 更新

基础:数组和向量计算 第 5 章 pandas 入门 第 6 章 数据加载、存储与文件格式 第 7 章 数据清洗和准备 第 8 章 数据规整:聚合、合并和重塑 第 9 章 绘图和可视化 第 10 章...快速入门 二、从 NumPy 基本原理开始 三、熟悉常用函数 四、您带来便利的便利函数 五、使用矩阵和 ufunc 六、深入探索 NumPy 模块 七、了解特殊例程 八、通过测试确保质量 九、matplotlib...秘籍 零、前言 一、Pandas 基础 二、数据帧基本操作 三、开始数据分析 四、选择数据子集 五、布尔索引 六、索引对齐 七、分组以进行汇总,过滤和转换 八、数据重组整齐的表格 九、组合 Pandas...,第一部分 – 索引和选择 五、Pandas 的操作,第二部分 – 数据的分组,合并和重塑 六、处理缺失数据,时间序列和 Matplotlib 绘图 七、统计之旅 – 经典方法 八、贝叶斯统计简介 九、...五、Pandas 的算术,函数应用以及映射 六、排序,索引和绘图 精通 Pandas 探索性分析 零、前言 一、处理不同种类的数据集 二、数据选择 三、处理,转换和重塑数据 四、像专业人士一样可视化数据

4.9K30

15个基本且常用Pandas代码片段

Pandas提供了强大的数据操作和分析功能,是数据科学的日常基本工具。在本文中,我们介绍最常用的15个Pandas代码片段。这些片段帮助简化数据分析任务,从数据集中提取有价值的见解。...pandas.melt() 是用于宽格式(wide format)的数据表格转换为长格式(long format)。...这个函数通常用于数据重塑(data reshaping)操作,以便容易进行数据分析和可视化。...col_level:如果输入数据是多级索引(MultiIndex),则可以指定在哪个级别上应用"融化"操作。...下面是一个示例,演示如何使用 melt() 函数宽格式数据转换为长格式,假设有以下的宽格式数据表格 df: ID Name Math English History 0 1

24610

数据科学 IPython 笔记本 7.8 分层索引

我们以标准导入开始: import pandas as pd import numpy as np 多重索引的序列 让我们首先考虑如何在一维Series中表示二维数据。...我们的基于元组的索引,本质上是一个基本的多重索引,而 PandasMultiIndex类型我们提供了我们希望拥有的操作类型。...与我们开始使用的自制的基于元组的多重索引解决方案相比,这种语法方便(并且操作更加高效!)。我们现在进一步讨论分层索引数据上的这种索引操作。...MultiIndex的创建方法 Series或DataFrame构造多重索引的最简单方法,是简单地两个或多个索引数组的列表传递给构造器。...重排多重索引 处理多重索引数据的关键之一,是知道如何有效地转换数据。有许多操作保留数据集中的所有信息,但为了各种计算的目的重新排列它。

4.2K20

NumPy 数组副本 vs 视图、NumPy 数组形状、重塑、迭代】

上例中的索引 4,我们的值 4,因此可以说第 5 个 ( 4 + 1 th) 维度有 4 个元素。 NumPy 数组重塑 重塑意味着更改数组的形状。 数组的形状是每个维中元素的数量。...通过重塑,我们可以添加或删除维度或更改每个维度中的元素数量。 从 1-D 重塑 2-D 实例 将以下具有 12 个元素的 1-D 数组转换为 2-D 数组。...我们可以 8 元素 1D 数组重塑 2 行 2D 数组中的 4 个元素,但是我们不能将其重塑 3 元素 3 行 2D 数组,因为这将需要 3x3 = 9 个元素。...实例 尝试具有 8 个元素的 1D 数组转换为每个维度中具有 3 个元素的 2D 数组(产生错误): import numpy as np arr = np.array([1, 2, 3, 4,...实例 8 个元素的 1D 数组转换为 2x2 元素的 3D 数组: import numpy as np arr = np.array([1, 2, 3, 4, 5, 6, 7, 8]) newarr

12010

Pandas图鉴(二):Series 和 Index

MultiIndex 我们拆分成四个部分,依次呈现~建议关注和星标@公众号:数据STUDIO,精彩内容等你来~ Part 2....在内部,Series数值存储在一个普通的NumPy向量中。因此,它继承了它的优点(紧凑的内存布局,快速的随机访问)和缺点(类型同质性,缓慢的删除和插入)。...对于非数字标签来说,这有点显而易见:为什么(以及如何Pandas在删除一行后,会重新标记所有后续的行?对于数字标签,答案就有点复杂了。...索引有一个名字(在MultiIndex的情况下,每一层都有一个名字)。而这个名字在Pandas中没有被充分使用。...一旦在索引中包含了列,就不能再使用方便的df.column_name符号了,而必须恢复到不太容易阅读的df.index或者通用的df.loc[]。有了MultiIndex

23020

在Python机器学习中如何索引、切片和重塑NumPy数组

在本教程中,你将了解在NumPy数组中如何正确地操作和访问数据。 完成本教程后,你知道: 如何将你的列表数据转换为NumPy数组。 如何使用Pythonic索引和切片访问数据。...教程概述 本教程分为4个部分; 他们是: 从列表到数组 数组索引 数组切片 数组重塑 1.从列表到数组 一般来说,我建议使用PandasNumPy函数从文件加载数据。...Rows: 3 Cols: 2 一维数组重塑二维数组 通常需要将一维数组重塑具有一列和多个数组的二维数组。 NumPyNumPy数组对象上提供reshape()函数,可用于重塑数据。...一维数组重塑具有一列的二维数组,在这种情况下,该元组将作为第一维(data.shape[0])中的数组形状和第二维的中1。...(5,) (5, 1) 二维数组重塑三维数组 对于需要一个或多个时间步长和一个或多个特征的多个样本的算法,通常需要将每行代表一个序列的二维数据重塑三维数组。

19.1K90

系统性的学会 Pandas, 看这一篇就够了!

开发出的库 专门用于数据挖掘的开源python库 以Numpy基础,借力Numpy模块在计算方面性能高的优势 基于matplotlib,能够简便的画图 独特的数据结构 1.1 为什么使用Pandas...,可读性就会友好: (2)便捷的数据处理能力 (3)读取文件方便 (4)封装了Matplotlib、Numpy的画图和计算 1.2 Pandas数据结构 Pandas中一共有三种数据结构,分别为...从版本0.20.0开始弃用:推荐的用于表示3D数据的方法是通过DataFrame上的MultiIndex方法。...所以我们需要知道Pandas如何进行读取和存储JSON格式。...(path_or_buf=None, orient=None, lines=False) Pandas 对象存储json格式 path_or_buf=None:文件地址 orient:存储的json

4K20

Pandas知识点-DataFrame数据结构介绍

Pandas基于numpy和matplotlib开发,既具有numpy的高性能数据处理能力,也具有matplotlib的绘图能力。...此外,Pandasnumpy和matplotlib的一些方法进行了更高层的封装和扩展,使用起来方便和快捷,功能也更加强大。...pandas读取DataFrame数据时,如果数据行数和列数很多,会自动数据折叠,中间的显示“...”。...日期设置行索引后,“日期”这一列数据变成了索引,数据中就不再有日期了。可见,set_index()移动了列的位置,从数据移动到了行索引(但没有删除数据)。...可以看到,当同时设置“日期”和“股票代码”行索引后,打印行索引的结果是MultiIndex(多重索引),而前面打印原始数据的行索引为Index。

2.3K40
领券