首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas入门教程

如果传递了 dict,排序后键将用作keys参数,除非传递,在这种情况下将选择(见下文)。任何 None 对象都将被静默删除,除非它们都是 None 在这种情况下将引发 ValueError 。...如果您在连接轴没有有意义索引信息情况下连接对象,这将非常有用。请注意,其他轴上索引连接仍然有效。 keys: 序列,默认无。使用传递键作为最外层构建分层索引。...如果通过了多个级别,则应包含元组。 levels: 序列列表,默认无。用于构建 MultiIndex 特定级别(唯一)。否则,它们将从密钥推断出来。 names: 列表,默认无。...可以是列名称、索引级别名称或长度等于 DataFrame 或 Series 长度数组;right_on:来自正确 DataFrame 或 Series 列或索引级别用作键。...可以是列名称、索引级别名称或长度等于 DataFrame 或 Series 长度数组 left_index:如果True,则使用左侧 DataFrame 或 Series 索引(行标签)作为其连接键

99430

python-for-data-groupby使用和透视表

groupby机制 组操作术语:拆分-应用-联合split-apply-combine。分离是特定轴上进行,axis=0表示行,axis=1表示列。...分组键 分组键可以是多种形式,并且键不一定是完全相同类型: 与需要分组轴向长度一致列表或者数组 DataFrame列名 可以轴索引或索引单个标签上调用函数 可以将分组轴向上和分组名称相匹配字典或者...Series 特点 分组键可以是正确长度任何数组 通用groupby方法是size,返回是一个包含组大小信息Series 分组任何缺失将会被排除在外 默认情况下,groupbyaxis...如果传递是(name,function)形式,则每个元组name将会被作为DF数据列名: ? 不同函数应用到一个或者多个列上 ?...笔记2:只有当多个函数应用到至少一个列时,DF才具有分层列 返回不含行索引聚合数据:通过向groupby传递as_index=False来实现 数据透视表和交叉表 DFpivot-table方法能够实现透视表

1.9K30

6种方式创建多层索引

本文主要介绍Pandas创建多层索引6种方式: pd.MultiIndex.from_arrays():多维数组作为参数,高维指定高层索引,低维指定低层索引。...pd.MultiIndex.from_tuples():元组列表作为参数,每个元组指定每个索引(高维和低维索引)。...pd.MultiIndex.from_frame:根据现有的数据框来直接生成 groupby():通过数据分组统计得到 pivot_table():生成透视表方式来得到 pd.MultiIndex.from_arrays...() In [1]: import pandas as pd import numpy as np 通过数组方式来生成,通常指定是列表元素: In [2]: # 列表元素是字符串和数字 array1...Python,我们使用 isinstance()函数 判断python对象是否可迭代: # 导入 collections 模块 Iterable 对比对象 from collections import

17720

Pandas0.25来了,别错过这10大好用新功能

提供了更简单写法,只需传递一个 Tuple 就可以了,Tuple 里第一个元素是指定列,第二个元素是聚合函数,看看下面的代码,是不是少敲了好多下键盘: animals.groupby('品种')....Pandas 提供了一种叫 pandas.NameAgg 命名元组(namedtuple),但如上面的代码所示,直接使用 Tuple 也没问题。 这两段代码效果是一样,结果都如下图所示。 ?...Groupby 聚合支持多个 lambda 函数 0.25 版有一个黑科技,以 list 方式向 agg() 函数传递多个 lambda 函数。为了减少键盘敲击量,真是无所不用其极啊!...优化了 MultiIndex 显示输出 MultiIndex 输出每行数据以 Tuple 显示,且垂直对齐,这样一来,MultiIndex 结构显示更清晰了。...缺失排序,groupby保留类别数据数据类型等,如需了解,详见官方文档 What's new in 0.25.0。

2.1K30

最全面的Pandas教程!没有之一!

如上,如果 Pandas 两个 Series 里找不到相同 index,对应位置就返回一个空 NaN。...多级索引(MultiIndex)以及命名索引不同等级 多级索引其实就是一个由元组(Tuple)组成数组,每一个元组都是独一无二。...你可以从一个包含许多数组列表创建多级索引(调用 MultiIndex.from_arrays ),也可以用一个包含许多元组数组(调用 MultiIndex.from_tuples )或者是用一对可迭代对象集合... DataFrame 缺少数据位置, Pandas 会自动填入一个空,比如 NaN或 Null 。...数值处理 查找不重复 不重复一个 DataFrame 里往往是独一无二,与众不同。找到不重复,在数据分析中有助于避免样本偏差。

25.8K63

pandas连接函数concat()函数「建议收藏」

如果传递了dict,则排序键将用作键参数,除非它被传递,在这种情况下,将选择(见下文)。任何无对象将被静默删除,除非它们都是无,在这种情况下将引发一个ValueError。...如果为True,请不要使用并置轴上索引。结果轴将被标记为0,…,n-1。如果要连接其中并置轴没有有意义索引信息对象,这将非常有用。注意,其他轴上索引连接仍然受到尊重。...用于其他n-1轴特定索引,而不是执行内部/外部设置逻辑。 keys:序列,默认无。使用传递键作为最外层构建层次索引。如果为多索引,应该使用元组。 levels:序列列表,默认无。...用于构建MultiIndex特定级别(唯一)。否则,它们将从键推断。 names:list,default无。结果层次索引级别的名称。...pandas文档:http://pandas.pydata.org/pandas-docs/stable/ 发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/132316

63310

Pandas 2.2 中文官方教程和指南(十一·二)

注意 应用可调用对象之前,将元组键解构为行(和列)索引,因此无法从可调用对象返回元组以索引行和列。 从具有多轴选择对象获取值使用以下表示法(以.loc为例,但.iloc也适用)。...,但如果你希望行具有不同概率,可以将 sample 函数抽样权重作为 weights 参数传递。...调用 isin 时,将一组作为数组或字典传递。如果是一个数组,则 isin 返回一个布尔 DataFrame,其形状与原始 DataFrame 相同,其中 True 表示元素序列。...other 参数,用于返回副本替换条件为 False 。....: In [293]: df2 = df.copy() MultiIndex query() 语法 您还可以像在框架列一样使用DataFrameMultiIndex级别: In [242

8810

Pandas merge用法解析(用Excel数据为例子)

如果未传递且left_index和right_index为False,则DataFrame交集将被推断为连接键。 left_on:左侧DataFrame列或索引级别用作键。...可以是列名,索引级名称,也可以是长度等于DataFrame长度数组。 right_on: 左侧DataFrame列或索引级别用作键。...对于具有MultiIndex(分层)DataFrame,级别数必须与右侧DataFrame连接键数相匹配。 right_index: 与left_index功能相似。...suffixes: 用于重叠列字符串后缀元组。默认为(‘x’,’ y’)。 copy: 始终从传递DataFrame对象复制数据(默认为True),即使不需要重建索引也是如此。..._merge是分类类型,并且对于其合并键仅出现在“左”DataFrame观察,取得为left_only,对于其合并键仅出现在“右”DataFrame观察为right_only,并且如果在两者中都找到观察点合并键

1.6K20

《利用Python进行数据分析·第2版》第10章 数据聚合与分组运算10.1 GroupBy机制10.2 数据聚合10.3 apply:一般性“拆分-应用-合并”10.4 透视表和交叉表10.5 总

本章你将会看到,由于Python和pandas强大表达能力,我们可以执行复杂得多分组运算(利用任何可以接受pandas对象或NumPy数组函数)。...本章,你将会学到: 使用一个或多个键(形式可以是函数、数组或DataFrame列名)分割pandas对象。 计算分组概述统计,比如数量、平均值或标准差,或是用户定义函数。...层次化索引数据集最方便地方就在于它能够根据轴索引一个级别进行聚合: In [47]: columns = pd.MultiIndex.from_arrays([['US', 'US', 'US',...top函数DataFrame各个片段上调用,然后结果由pandas.concat组装到一起,并以分组名称进行了标记。于是,最终结果就有了一个层次化索引,其内层索引来自原DataFrame。...Python和pandas,可以通过本章所介绍groupby功能以及(能够利用层次化索引)重塑运算制作透视表。

4.8K90

Pandas 2.2 中文官方教程和指南(十五)

StringArray缺失将在比较操作传播,而不总是像numpy.nan那样比较不相等。 本文档其余部分所有内容同样适用于string和object dtype。...特别是,对齐也意味着不同长度不再需要一致。... pandas 1.0 之前,object dtype 是唯一选择。这在很多方面都是不幸object dtype 数组可能会意外存储字符串和非字符串混合。...StringArray缺失将在比较操作传播,而不像numpy.nan那样总是比较不相等。 本文档其余部分其他内容同样适用于string和object dtype。...StringArray缺失将在比较操作传播,而不像numpy.nan那样总是比较不相等。 本文档其余部分所有内容同样适用于string和object dtype。

11510

Pandas图鉴(三):DataFrames

要想从中得到一个标量值,你可以使用: float(s)或更通用s.item(),都会引发ValueError,除非系列中正好有一个。...1:1关系joins 这时,关于同一组对象信息被存储几个不同DataFrame,而你想把它合并到一个DataFrame。 如果你想合并列不在索引,可以使用merge。...如果该列已经索引,你可以使用join(这只是merge一个别名,left_index或right_index设置为True,默认不同)。...它将索引和列合并到MultiIndex: eset_index 如果你想只stack某些列,你可以使用melt: 请注意,熔体以不同方式排列结果行。...在上面的例子,所有的都是存在,但它不是必须: 对数值进行分组,然后对结果进行透视做法非常普遍,以至于groupby和pivot已经被捆绑在一起,成为一个专门函数(和一个相应DataFrame

32820
领券