首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【Mark一下】46个常用 Pandas 方法速查表

数据与RDataFrame格式类似,都是一个二维数组。Series则是一个一维数组,类似于列表。数据Pandas中最常用数据组织方式对象。...例如可以dtype返回仅获取类型为bool列。 3 数据切片切块 数据切片切块是使用不同列或索引切分数据,实现从数据获取特定子集方式。...常见数据切片切换方式如表3所示: 表3 Pandas常用数据切分方法 方法用途示例示例说明[['列名1', '列名2',…]]按列名选择单列或多列In: print(data2[['col1','...[0:2)之间,列名为'col1''col2'记录,索引不包含2 提示 如果选择特定索引数据,直接写索引即可。...,默认计算方式为求均值 8 高级函数使用 Pandas能直接实现数据级别高级函数应用,而不用写循环遍历每条记录甚至每个后做计算,这种方式能极大提升计算效率,具体如表8所示: 表8 Pandas

4.7K20

Python替代Excel Vba系列(三):pandas处理不规范数据

本文要点: 使用 pandas 处理不规范数据pandas 索引。...---- 处理标题 pandas DataFrame 最大好处是,我们可以使用列名字操作数据,这样子就无需担心列位置变化。因此需要把标题处理好。...此外 pandas 中有各种内置填充方式。 ffill 表示用上一个有效填充。 合并单元格很多时候就是第一个有,其他为空,ffill 填充方式刚好适合这样情况。...如下是一个 DataFrame 组成部分: 红框是 DataFrame 部分(values) 上方深蓝色是 DataFrame 索引(columns),注意,为什么方框不是一?...是因为 DataFrame 允许多层次索引。类似于平时复合表头。 左方深蓝色是 DataFrame 索引(index)。

5K30
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas Query 方法深度总结

大多数 Pandas 用户都熟悉 iloc[] loc[] 索引器方法,用于 Pandas DataFrame 检索列。...因此,在今天文章,我们将展示如何使用 query() 方法对数据执行查询 获取数据 我们使用 kaggle 上 Titanic 数据集作为本文章测试数据集,下载地址如下: https://www.kaggle.com...pd df = pd.read_csv('titanic_train.csv') df 数据集有 891 12 列: 使用 query() 方法 让我们找出南安普敦 (‘S’) 出发所有乘客...结果是一个 DataFrame,其中包含所有南安普敦出发乘客: query() 方法接受字符串作为查询条件串,因此,如果要查询字符串列,则需要确保字符串被正确括起来: 很多时候,我们可能希望将变量值传递到查询字符串...,当应用于列名时,我们可以使用 isnull() 方法查找缺失: df.query('Embarked.isnull()') 现在将显示 Embarked 列缺少: 其实可以直接在列名上调用各种

1.3K30

pandas操作excel全总结

首先,了解下pandas两个主要数据结构,一个是Series,另一个是DataFrame。 Series一种增强一维数组,类似于列表,由索引(index)(values)组成。...DataFrame是一个类似表格二维数据结构,索引包括列索引索引,每列可以是不同类型(数值、字符串、布尔等)。DataFrame每一每一列都是一个Series。...默认是'\t'(也就是tab)切割数据 header:指定表头,即列名,默认第一,header = None, 没有表头,全部为数据内容 encoding:文件编码方式,不设置此选项, Pandas...index_col ,指定索引对应列为数据标签,默认 Pandas 0、1、2、3 做自然排序分配给各条记录。...(df) 增删改查常用方法,已整理成思维导图,便于大家查阅学习: 「两种查询方法介绍」 「loc」 根据,列标签查询 「iloc」 通过行号索引数据,行号0开始,逐次加1。

20.9K43

PythonPandas相关操作

1.Series(序列):Series是Pandas一维标记数组,类似于带标签数组。它可以容纳任何数据类型,并具有标签(索引),用于访问操作数据。...2.DataFrame(数据):DataFrame是Pandas二维表格数据结构,类似于电子表格或SQL表。它由列组成,每列可以包含不同数据类型。...DataFrame可以各种数据创建,如CSV文件、Excel文件、数据库等。 3.Index(索引):索引Pandas中用于标识访问数据标签。它可以是整数、字符串或其他数据类型。...每个SeriesDataFrame对象都有一个默认整数索引,也可以自定义索引。 4.选择过滤数据Pandas提供了灵活方式选择、过滤操作数据。...可以使用标签、位置、条件等方法来选择特定列。 5.缺失数据处理:Pandas具有处理缺失数据功能,可以检测、删除或替换数据缺失

24030

pandas技巧6

本篇博文主要是对之前几篇关于pandas使用技巧小结,内容包含: 创建S型或者DF型数据,以及如何查看数据 选择特定数据 缺失处理 apply使用 合并和连接 分组groupby机制 重塑reshaping...'F': 'foo'}) # 使用布尔 选择数据 head(),默认是头5 tail() df.index/df.columns df.describe() 查看各种统计信息 df.T 转置...分组聚合之后使用reset_index() 在分组时,使用as_index=False 重塑reshaping stack:将数据列旋转成行,AB由列属性变成行索引 unstack:将数据旋转成列...,AB由索引变成列属性 透视表 data: a DataFrame object,要应用透视表数据 values: a column or a list of columns to aggregate...values是生成透视表数据 index是透视表层次化索引,多个属性使用列表形式 columns是生成透视表列属性

2.6K10

使用pandas进行数据快捷加载

默认情况下,pandas会将数据存储到一个专门数据结构,这个数据结构能够实现按索引、通过自定义分隔符分隔变量、推断每一列正确数据类型、转换数据(如果需要的话),以及解析日期、缺失出错数据。...现在,我们只需要了解,pandas索引(Index)类就像表字典索引一样。...以下是X数据后4数据: ? 在这个例子,得到结果是一个pandas数据。为什么使用相同函数却有如此大差异呢?...那么,在前一个例子,我们想要抽取一列,因此,结果是一维向量(即pandas series)。 在第二个例子,我们要抽取多列,于是得到了类似矩阵结果(我们知道矩阵可以映射为pandas数据)。...为了获得数据维数,只需在pandas数据series上使用属性shape,如下面的例子所示: print (X.shape) #输出:(150,2) print (y.shape) #输出:(150

2.1K21

Day4.利用Pandas数据处理

此外我们还要掌握常见取数方法,取列,包括某行某列,连续列,间断列,单个数据等,这些取数方法与NumPy取数方法相同,括号索引以逗号分隔,逗号前为,后为列。...,列,列名 一列多少数据), non-null 数据非空,类型是object字符串,占用内存 None是无返回,这里jupyter编辑器中使用print函数有关,帮助显示df.info()有无返回...(df1) # 使用rename函数,给索引列名加上‘_ABC’ 通过自定义函数(x是原有的行列) 实现 def test_map(x): return x+'_ABC' # inplace...b 1 1 b 1 c 2 2 c 2 d 3 3 d 2 e 4 4 e 2 将一列数据变为索引好处是,索引0开始,如果要按照表格一列,如id列序号,1...obj 要插入列表对象(列名) col_name=df1.columns.tolist() # 将数据列名全部提取出来存放在列表里 col_name.insert(2,'city') # 在列索引

6K10

通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

Pandas 索引可以设置为一个(或多个)唯一,这就像在工作表中有一列用作标识符一样。与大多数电子表格不同,这些索引实际上可用于引用。...我们可以用多种不同方式构建一个DataFrame,但对于少量,通常将其指定为 Python 字典会很方便,其中键是列名数据。...在 Pandas ,您使用特殊方法/向 Excel 文件读取写入。 让我们首先基于上面示例数据,创建一个新 Excel 文件。 tips.to_excel("....过滤 在 Excel ,过滤是通过图形菜单完成。 可以通过多种方式过滤数据,其中最直观使用布尔索引。...列选择 在Excel电子表格,您可以通过以下方式选择所需列: 隐藏列; 删除列; 引用从一个工作表到另一个工作表范围; 由于Excel电子表格列通常在标题命名,因此重命名列只需更改第一个单元格文本即可

19.5K20

一文介绍Pandas9种数据访问方式

导读 Pandas之于日常数据分析工作重要地位不言而喻,而灵活数据访问则是其中一个重要环节。本文旨在讲清Pandas9种数据访问方式,包括范围读取条件查询等。 ?...以下面经典titanic数据集为例,可以两个方面特性来认识DataFrame: ? DataFrame是一个行列均由多个Series组成二维数据,其中Series可看做是一个一维向量。...例如,当标签列类型(可通过df.index.dtype查看)为时间类型时,若使用无法隐式转换为时间字符串作为索引切片,则引发报错 ? 切片形式返回查询,且为范围查询 ?...切片类型与索引列类型不一致时,引发报错 2. loc/iloc,可能是除[]之外最为常用两种数据访问方法,其中loc按标签列名索引取值)访问、iloc按数字索引访问,均支持单访问或切片查询...语法执行数据访问方式,这对熟悉SQL使用者来说非常有帮助!

3.7K30

Pandas进阶|数据透视表与逆透视

在实际数据处理过程数据透视表使用频率相对较高,今天云朵君就和大家一起学习pandas数据透视表与逆透视使用方法。...本次使用数据来源于Kaggle,车辆被警察拦下并进行搜查记录数据集,简称车辆数据。文末有下载方式,大家按需获取。...使用车辆数据集统计不同性别司机平均年龄,聚合后用二维切片可以输出DataFrame数据。...可以使任何对groupby有效函数 fill_value 用于替换结果表缺失 dropna 默认为True margins_name 默认为'ALL',当参数margins为True时,ALL名字...索引索引都可以再设置为多层,不过索引索引在本质上是一样,大家需要根据实际情况合理布局。

4.1K10

从小白到大师,这里有一份Pandas入门指南

,确保列名类型是正确。...它可以通过两种简单方法节省高达 90% 内存使用: 了解数据使用类型; 了解数据可以使用哪种类型来减少内存使用(例如,price 这一列在 0 到 59 之间,只带有一位小数,使用 float64...索引 Pandas 是强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储在 numpy 数组。这是什么意思?...一旦加载了数据,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引索引)都是最好选择。...否则,对于 DataFrame 每一个新Pandas 都会更新索引,这可不是简单哈希映射。

1.8K11

从小白到大师,这里有一份Pandas入门指南

,确保列名类型是正确。...它可以通过两种简单方法节省高达 90% 内存使用: 了解数据使用类型; 了解数据可以使用哪种类型来减少内存使用(例如,price 这一列在 0 到 59 之间,只带有一位小数,使用 float64...索引 Pandas 是强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储在 numpy 数组。这是什么意思?...一旦加载了数据,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引索引)都是最好选择。...否则,对于 DataFrame 每一个新Pandas 都会更新索引,这可不是简单哈希映射。

1.7K30

从小白到大师,这里有一份Pandas入门指南

,确保列名类型是正确。...它可以通过两种简单方法节省高达 90% 内存使用: 了解数据使用类型; 了解数据可以使用哪种类型来减少内存使用(例如,price 这一列在 0 到 59 之间,只带有一位小数,使用 float64...索引 Pandas 是强大,但也需要付出一些代价。当你加载 DataFrame 时,它会创建索引并将数据存储在 numpy 数组。这是什么意思?...一旦加载了数据,只要正确管理索引,就可以快速地访问数据。 访问数据方法主要有两种,分别是通过索引查询访问。根据具体情况,你只能选择其中一种。但在大多数情况索引索引)都是最好选择。...否则,对于 DataFrame 每一个新Pandas 都会更新索引,这可不是简单哈希映射。

1.7K30

快乐学习Pandas入门篇:Pandas基础

/data 编码方式 分隔符 列名 #读取csv文件df = pd.read_csv('./data....索引对齐特性 这是Pandas中非常强大特性,在对多个DataFrame 进行合并或者加减乘除操作时,索引都重叠时候才能进行相应操作,否则会使用NA进行填充。...对于Series,它可以迭代每一列()操作;对于DataFrame,它可以迭代每一个列操作。 # 遍历Math列所有,添加!...Series 属性方法 说明 s.values 访问s内容 s.index 获取s索引 s.iteritems() 获取索引对 s.dtype 获取s数据类型 s[‘a’] 根据索引访问元素...在常用函数一节,由于一些函数功能比较简单,因此没有列入,现在将它们列在下面,请分别说明它们用途并尝试使用。 ? 5. df.mean(axis=1)是什么意思?

2.4K30

图解pandas模块21个常用操作

3、字典创建一个系列 字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引索引与标签对应数据将被拉出。 ?...4、序列数据访问 通过各种方式访问Series数据,系列数据可以使用类似于访问numpyndarray数据来访问。 ?...9、列选择 在刚学Pandas时,选择选择非常容易混淆,在这里进行一下整理常用选择。 ? 10、选择 整理多种选择方法,总有一种适合你。 ? ? ?...18、查找替换 pandas提供简单查找替换功能,如果要复杂查找替换,可以使用map(), apply()applymap() ?...19、数据合并 两个DataFrame合并,pandas会自动按照索引对齐,可以指定两个DataFrame对齐方式,如内连接外连接等,也可以指定对齐索引列。 ?

8.5K12

14个pandas神操作,手把手教你写代码

、处理缺失、填充默认、补全格式、处理极端等; 建立高效索引; 支持大体量数据; 按一定业务逻辑插入计算后列、删除列; 灵活方便数据查询、筛选; 分组聚合数据,可独立指定分组后各字段计算方式...查看数值型列汇总统计 df.dtypes # 查看各字段类型 df.axes # 显示数据列名 df.columns # 列名 df.info()显示有数据类型、索引情况、行列数、各字段数据类型...注意,这里并没有修改原Excel,我们读取数据后就已经和它没有关系了,我们处理是内存df变量。 将name建立索引后,就没有0开始数字索引了,如图4所示。 ?..., y]是一个非常强大数据选择函数,其中x代表,y代表列,列都支持条件表达式,也支持类似列表那样切片(如果要用自然索引,需要用df.iloc[])。...(2)选择 选择方法如下: # 用指定索引选取 df[df.index == 'Liver'] # 指定姓名 # 用自然索引选择,类似列表切片 df[0:3] # 取前三 df[0

3.3K20

数据分析索引总结(上)Pandas单级索引

读取csv数据时候, 使用参数index_col指定表列作为索引 import numpy as np import pandas as pd df = pd.read_csv('data/table.csv...逗号后 7::-2 表示第8列开始,向前每隔一列取一列(步长为2, 2前负号表示向前迭代) df.iloc[:,7::-2].head() ⑤ 混合索引 第四开始向后以步长为4选择, 第八列开始向前以步长为...df[['School','Math']].head() 使用loc方式 df.loc[:,['School','Math']].head() 使用iloc方式--传入列名是默认整数索引,0开始 df.iloc...]相应位置都能使用布尔列表选择: 如果不加values就会索引对齐发生错误,Pandas索引对齐是一个重要特征,很多时候非常使用。...返回所有的索引(转换为区间后)与给定区间有重叠。 cut得到区间实际上是个catagory 类型数据,并不能直接用来判断给定区间是否重合,必须使用astype转换为区间类型数据

5K40

Pandas速查卡-Python数据科学

它不仅提供了很多方法函数,使得处理数据更容易;而且它已经优化了运行速度,与使用Python内置函数进行数值数据处理相比,这是一个显著优势。...() pd.DataFrame(dict) 字典、列名称键、数据列表导入 输出数据 df.to_csv(filename) 写入CSV文件 df.to_excel(filename) 写入Excel...('1900/1/30', periods=df.shape[0]) 添加日期索引 查看/检查数据 df.head(n) 数据前n df.tail(n) 数据后n df.shape() 行数列数...) 所有列唯一计数 选择 df[col] 返回一维数组col列 df[[col1, col2]] 作为新数据返回列 s.iloc[0] 按位置选择 s.loc['index_one'] 按索引选择...df.describe() 数值列汇总统计信息 df.mean() 返回所有列平均值 df.corr() 查找数据列之间相关性 df.count() 计算每个数据非空数量 df.max

9.2K80
领券