首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

在 Pandas ,如果未指定索引,则默认使用 RangeIndex(第一 = 0,第二 = 1,依此类推),类似于电子表格标题/数字。...在 Pandas 索引可以设置为一个(或多个)唯一,这就像在工作表中有一列用作标识符一样。与大多数电子表格不同,这些索引实际上可用于引用。...索引也是持久,所以如果你对 DataFrame 重新排序,特定标签不会改变。 5. 副本与就地操作 大多数 Pandas 操作返回 Series/DataFrame 副本。...tips[tips["total_bill"] > 10] 结果如下: 上面的语句只是一系列 True/False 对象传递给 DataFrame,返回所有带有 True 。...排序 Excel电子表格排序,是通过排序对话框完成。 pandas 有一个 DataFrame.sort_values() 方法,它需要一个列列表来排序。

19.5K20

三个你应该注意错误

DataFrame只有10,所以我们能够注意到缺失。...在PandasDataFrame上进行索引非常有用,主要用于获取和设置数据子集。 我们可以使用和列标签以及它们索引来访问特定和标签集。 考虑我们之前示例促销DataFrame。...根据Pandas文档,“分配给链式索引乘积具有内在不可预测结果”。主要原因是我们无法确定索引操作是否会返回视图或副本。因此,我们尝试更新可能会更新,也可能不会更新。...这些方法用于从DataFrame中选择子集。 loc:和列标签进行选择 iloc:和列位置进行选择 默认情况下,Pandas整数值(从0开始)分配为标签。...因此,标签和索引变得相同。 让我们在我们促销DataFrame上做一个简单示例。虽然它很小,但足够演示我即将解释问题。 考虑一个需要选择前4情况。

7610
您找到你想要的搜索结果了吗?
是的
没有找到

python数据科学系列:pandas入门详细教程

这里提到了index和columns分别代表标签和列标签,就不得不提到pandas另一个数据结构:Index,例如series中标签列、dataframe中行标签和列标签均属于这种数据结构。...切片类型与索引列类型不一致时,引发报错 loc/iloc,最为常用两种数据访问方法,其中loc标签访问、iloc数字索引访问,均支持单访问或切片查询。...检测各行是否重复,返回一个索引bool结果,可通过keep参数设置保留第一/最后一/无保留,例如keep=first意味着在存在重复多行时,首被认为是合法而可以保留 删除重复,drop_duplicates...,可通过axis参数设置是删除还是列删除 替换,replace,非常强大功能,对series或dataframe每个元素执行条件替换操作,还可开启正则表达式功能 2 数值计算 由于pandas...;sort_values是排序,如果是dataframe对象,也可通过axis参数设置排序方向是还是列,同时根据by参数传入指定或者列,可传入多行或多列并分别设置升序降序参数,非常灵活。

13.8K20

Python 数据处理:Pandas库使用

计算并集 isin 计算一个指示各是否都包含在参数集合布尔型数组 delete 删除索引i处元素,并得到新Index drop 删除传入,并得到新Index insert 元素插入到索引...,函数应用到由各列或所形成一维数组上。...无论如何,在计算相关系数之前,所有的数据项都会标签对齐。 ---- 3.2 唯一计数以及成员资格 还有一类方法可以从一维Series抽取信息。...计算Series唯一数组,发现顺序返回 value_counts 返回一个Series,其索引为唯一,其为频率,计数值降序排列 有时,你可能希望得到DataFrame多个相关列一张柱状图...apply函数,就会出现: result = data.apply(pd.value_counts).fillna(0) print(result) 这里,结果标签是所有唯一

22.7K10

Pandas知识点-添加操作append

append()方法通过添加方式实现了合并功能,这种合并功能是(纵向)进行合并,合并结果行数是所有DataFrame行数之和。 二填充不存在列 ---- ?...如果需要,可以批量DataFrame合并成一个DataFrame。 四重设索引 ---- ?...即使指定nameDataFrame索引重复,也可以添加成功(verify_integrity不为True)。...联合操作是一个DataFrame部分数据用另一个DataFrame数据替换或补充,通过一个函数来定义联合时取数据规则。在联合过程还可以对空进行填充。...append(): 添加操作,可以多个DataFrame添加到一个DataFrame方式进行添加。添加操作只是多个DataFrame拼接到一起,可以重设索引

4.6K30

Pandas知识点-算术运算函数

两个DataFrame相加,如果DataFrame形状和对应索引都一样,直接将对应位置(索引和列索引确定位置)数据相加,得到一个新DataFrame。 2....fillna(value): 运算出结果后,所有位置都填充成指定。 在算术运算函数,可以使用fill_value参数,在运算前先填充数据。 ?...与DataFrame不同是,使用fill_value参数先填充数据再进行运算时,结果不会有空。因为Series是一维数据,对Series填充时,不存在两个Series都是填充值索引。...如果Series索引DataFrame索引相同,会将Series依次与DataFrame每一数据进行运算,得到一个新DataFrame。 2....如果Series索引DataFrame索引对应,要使Series列与DataFrame运算,可以axis参数设置成0或'index',这样会将Series依次与DataFrame每一列数据进行运算

1.9K40

最全面的Pandas教程!没有之一!

获取 DataFrame 或多行数据 要获取某一,你需要用 .loc[] 来索引(标签名)引用这一,或者用 .iloc[],这行在表位置(行数)来引用。 ?...索引 类似地,我们还可以用 .set_index() 方法, DataFrame某一列作为索引来用。...交叉选择和列数据 我们可以用 .xs() 方法轻松获取到多级索引某些特定级别的数据。比如,我们需要找到所有 Levels ,Num = 22 : ?...比如,表中所有 NaN 替换成 20 : ? 当然,这有的时候打击范围太大了。于是我们可以选择只对某些特定或者列进行填充。比如只对 'A' 列进行操作,在空处填入该列平均值: ?...,index 表示该列进行分组索引,而 columns 则表示最后结果该列数据进行分列。

25.8K64

pandas数据清洗,排序,索引设置,数据选取

take_last=True)# 保留 k1和k2 组合唯一,take_last=True 保留最后一 ---- 排序 索引排序 # 默认axis=0,索引对行进行排序;ascending...(axis=0) #average 相等时,取排名平均值 #min 相等时,取排名最小 #max 相等时,取排名最大 #first相等时,原始数据出现顺序排名 ---- 索引设置 reindex...","California"] df2 = df1.reindex( columns=states ) set_index() DataFrame列columns设置成索引index 打造层次化索引方法...# columns其中两列:race和sex设置索引,race为一级,sex为二级 # inplace=True 在原数据集上修改 adult.set_index(['race','sex...s.isin([1,2,3]) df['A'].isin([1,2,3]) df.loc[df['A'].isin([5.8,5.1])]选取列A中值为5.8,5.1所有组成dataframe query

3.2K20

直观地解释和可视化每个复杂DataFrame操作

每种方法都将包括说明,可视化,代码以及记住它技巧。 Pivot 透视表创建一个新“透视表”,该透视表数据现有列投影为新表元素,包括索引,列和。...要记住:从外观上看,堆栈采用表二维性并将列堆栈为多级索引。 Unstack 取消堆叠获取多索引DataFrame并对其进行堆叠,指定级别的索引转换为具有相应DataFrame列。...堆叠参数是其级别。在列表索引索引为-1返回最后一个元素。这与水平相同。级别-1表示取消堆叠最后一个索引级别(最右边一个)。...Concat 合并和连接是水平工作,串联或简称为concat,而DataFrame(垂直)连接。...串联是附加元素附加到现有主体上,而不是添加新信息(就像逐列联接一样)。由于每个索引/行都是一个单独项目,因此串联将其他项目添加到DataFrame,这可以看作是列表。

13.3K20

20个能够有效提高 Pandas数据分析效率常用函数,附带解释和例子

对于标签,如果我们不分配任何特定索引,pandas默认创建整数索引。因此,标签是从0开始向上整数。与iloc一起使用位置也是从0开始整数。...Melt Melt用于维数较大 dataframe转换为维数较少 dataframe。一些dataframe包含连续度量或变量。在某些情况下,这些列表示为可能更适合我们任务。...如果axis参数设置为1,nunique返回每行唯一数目。 13. Lookup 'lookup'可以用于根据、列标签在dataframe查找指定。假设我们有以下数据: ?...inner:仅在on参数指定具有相同(如果未指定其它方式,则默认为 inner 方式) outer:全部列数据 left:左一dataframe所有列数据 right:右一dataframe...Applymap Applymap用于一个函数应用于dataframe所有元素。请注意,如果操作矢量化版本可用,那么它应该优先于applymap。

5.5K30

004.python科学计算库pandas()

pivot表级别将存储在结果DataFrame索引和列上索引对象(层次索引) # index 告诉方法哪个列分组 # values 是我们要应用计算列(可选地聚合列) #...axis = 0或'index': 删除包含缺失 # axis = 1或'columns': 删除包含缺失列 # subset 像数组一样,可选标签沿着要考虑其他轴,例如,如果要删除...索引下标从0开始) row_index_83_age = titanic_survival.loc[83, "Age"] # 获取第767数据Pclass列 (loc索引下标从0开始) row_index...DataFrame,返回新DataFrame,并在索引名下中标记信息, # 如果没有,默认为'level_0'、'level_1'等。...# drop : boolean, default False 不要尝试在dataframe插入索引。这会将索引重置为默认整数索引

63220

Python数据分析笔记——Numpy、Pandas库

Pandas基本功能 1、重新索引 Pandas对象一个方法就是重新索引(reindex),其作用是创建一个新索引,pandas对象这个新索引进行排序。对于不存在索引,引入缺失。...也可以columns()进行重新索引,对于不存在列名称,将被填充空。 对于不存在索引带来缺失,也可以在重新索引时使用fill_value给缺失填充指定。...(2)DataFrame与Series之间运算 DataFrame每一与Series分别进行运算。...obj.rank() (2)DataFrame数据结构排序和排名 索引进行排列,一列或多列进行排序,通过by列名传递给sort_index. 5、缺失数据处理 (1)滤出缺失数据 使用data.dropna...()可以滤出缺失数据,默认情况下,data.dropna()滤出含有缺失所有(是含有缺失数据那一整行)。

6.4K80

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

DataFrame既有索引也有列索引,它可以被看做由Series组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...5.2 基本功能 本节,我介绍操作Series和DataFrame数据基本手段。后续章节更加深入地挖掘pandas在数据分析和处理方面的功能。...在本例,我们目的是匹配DataFrame索引(axis='index' or axis=0)并进行广播。...方法用于计算两个Series重叠、非NA索引对齐相关系数。...无论如何,在计算相关系数之前,所有的数据项都会标签对齐。 唯一计数以及成员资格 还有一类方法可以从一维Series抽取信息。

6K70

Pandas图鉴(三):DataFrames

df.shape返回和列数量。 df.info()总结了所有相关信息 还可以一个或几个列设置为索引。...这个过程如下所示: 索引在Pandas中有很多用途: 它使通过索引查询更快; 算术运算、堆叠、连接是索引排列;等等。 所有这些都是以更高内存消耗和更不明显语法为代价。...DataFrame列进行算术运算,只要它们是有意义标签,如下图所示: 索引DataFrames 普通方括号根本不足以满足所有索引需求。...垂直stacking 这可能是两个或多个DataFrame合并为一个最简单方法:你从第一个DataFrame中提取,并将第二个DataFrame附加到底部。...同时保持了左边DataFrame索引顺序不变。

35120

Pandas知识点-连接操作concat

连接和列连接 ---- DataFrame连接时,可以连接(纵向)也可以列连接(横向)。 1. 连接 ? 先创建两个DataFrame,然后连接。 ?...concat()第一个参数通常传入一个由Series或DataFrame组成列表,表示列表数据连接到一起,连接顺序与列表顺序相同。也可以传入一个字典,后面会介绍。...在这两个例子连接时,两个DataFrame索引相同,列连接时,两个DataFrame索引相同,所以结果看起来很直观。 3. 被连接数据索引不同 ? 连接原理如下。 ?...这个例子,两个DataFrame索引和列索引都不相等,将它们连接时,先将两个DataFrame拼接起来,然后在每行没有数据列填充空列连接同理。...如果取是交集,修改行索引过程为:先按取交集方式连接,然后在结果增加比修改索引,增加回填充空。 五重设结果索引 ---- ?

2K50

python pandas 基础之一

value_counts(), 返回各个不同元素,并计算元素在Series个数。 isin(), 用来判断所属关系,判断给定一列元素是否包含在Series数据结构。isin()返回布尔。...它能够通过标签对齐,其中标签不一致为NaN 二. pandas: 数据结构跟excel类似,类似于Series使用场景应用多维。各列数据结构可以是不同类型。...也可以指定特定标签. frame=pa.DataFrame(data, index=['one','two', 'three','four']) 选取元素: 选取所有名称:frame.columns...获取索引列表:frame.index 获取所有的元素:frame.values 获取一列,用列名称即可:frame['price'],返回一个Series对象 另一种获取列方法:frame.price...转置:frame.T 用嵌套字典生成DataFrame对象,pandas会将外部键当作列名称,内部键当作index索引

1.3K50

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券