首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

30 个小例子帮你快速掌握Pandas

2.读取时选择特定列 我们只打算读取csv文件某些列。读取时,列列表将传递给usecols参数。如果您事先知道列名,比以后删除更好。...= df.sample(frac=0.1) df_sample2.shape --- (1000,10) 5.缺失检查 isna函数用于确定DataFrame缺失。...第一个参数是位置索引,第二个参数是列名称,第三个参数是。 19.where函数 它用于根据条件替换行或列。默认替换是NaN,但我们也可以指定要替换。...method参数指定如何处理具有相同行。first表示根据它们在数组(即列)顺序对其进行排名。 21.列唯一数量 使用分类变量时,很方便。我们可能需要检查唯一类别的数量。...Geography列内存消耗减少了近8倍。 24.替换 替换函数可用于替换DataFrame。 ? 第一个参数是要替换,第二个参数是新。 我们可以使用字典进行多次替换。 ?

10.6K10

高效10个Pandas函数,你都用过吗?

pandas如此受欢迎原因是简洁、灵活、功能强大语法。 这篇文章将会配合实例,讲解10个重要pandas函数。其中有一些很常用,相信你可能用到过。...Where Where用来根据条件替换行或列如果满足条件,保持原来,不满足条件替换为其他。默认替换为NaN,也可以指定特殊。..., raise_on_error=None) 参数作用: cond:布尔条件如果 cond 为真,保持原来,否则替换为other other:替换特殊 inplace:inplace为真则在原数据上操作...,为False则在原数据copy上操作 axis:行或列 将df列value_1里小于5替换为0: df['value_1'].where(df['value_1'] > 5 , 0) Where...比如有一个序列[1,7,5,3],使用rank从小到大排名后,返回[1,4,3,2],这就是前面那个序列每个排名位置。

4.1K20
您找到你想要的搜索结果了吗?
是的
没有找到

20个能够有效提高 Pandas数据分析效率常用函数,附带解释和例子

Where where函数用于指定条件数据替换如果不指定条件默认替换为 NaN。 df['new_col'].where(df['new_col'] > 0, 0) ?...Merge Merge()根据共同列组合dataframe。考虑以下两个数据: ? 我们可以基于列共同合并它们。设置合并条件参数是“on”参数。 ?...inner:仅在on参数指定具有相同行(如果未指定其它方式,默认为 inner 方式) outer:全部列数据 left:左一dataframe所有列数据 right:右一dataframe...Replace 顾名思义,允许替换dataframe。第一个参数是要替换,第二个参数是新。 df.replace('A', 'A_1') ? 我们也可以在同一个字典多次替换。...Applymap Applymap用于将一个函数应用于dataframe所有元素。请注意,如果操作矢量化版本可用,那么应该优先于applymap。

5.5K30

如何用 Python 执行常见 Excel 和 SQL 任务

在 Python ,不需要知道很多关于正则表达式知识,但它们是一个强大工具,可用于匹配和替换某些字符串或子字符串。如果你想了解更多,请参考以下教程。 ? 信任这个网站一些代码。...每个括号内列表都代表了我们 dataframe 一行,每列都以 key 表示:我们正在处理一个国家排名,人均 GDP(以美元表示)及其名称(用「国家」)。...请注意,Python 索引从0开始,而不是1,这样,如果要调用 dataframe 第一个使用0而不是1!你可以通过在圆括号内添加你选择数字来更改显示行数。试试看!...使用 len 方法快速检查(一个用于计算 dataframe 行数救星!)表示我们有 25 个国家符合。 ? ? 要是我们想把这两个过滤条件连在一起呢? 这里是连接过滤方法。...在多个过滤条件之前,你想要了解工作原理。你还需要了解 Python 基本操作符。为了这个练习目的,你只需要知道「&」代表 AND,而「|」代表 Python OR。

10.7K60

50个Pandas奇淫技巧:向量化字符串,玩转文本处理

确定替换是否区分大小写: 如果为 True,区分大小写(如果 pat 是字符串,默认为) 设置为 False 不区分大小写 如果 pat 是编译正则表达式,则无法设置。...如果 pat 是编译正则表达式,则无法设置。 regex:布尔,默认为真。确定 passed-in 模式是否为正则表达式: 如果为 True,假定 passed-in 模式是正则表达式。...:布尔(如果为true),每个空格字符均被单个空格替换。...repl:str,可选 用于替换字符串。如果未指定 (None),切片区域将替换为空字符串。...如果其他是包含 Series、Index 或 np.ndarray (1-dim) 组合 list-like,所有元素都将被解包并且必须单独满足上述条件

5.9K60

用Python执行SQL、Excel常见任务?10个方法全搞定!

在 Python ,不需要知道很多关于正则表达式知识,但它们是一个强大工具,可用于匹配和替换某些字符串或子字符串。如果你想了解更多,请参考以下内容。 ?...你可以将上面的代码复制粘贴到你自己 Anaconda 如果你用一些 Python 代码运行,可以迭代! 下面是代码输出,如果你不修改,就是所谓字典。 ?...请注意,Python 索引从0开始,而不是1,这样,如果要调用 dataframe 第一个使用0而不是1!你可以通过在圆括号内添加你选择数字来更改显示行数。试试看!...使用 len 方法快速检查(一个用于计算 dataframe 行数救星!)表示我们有 25 个国家符合。 ? 要是我们想把这两个过滤条件连在一起呢? 这里是连接过滤方法。...在多个过滤条件之前,你想要了解工作原理。你还需要了解 Python 基本操作符。为了这个练习目的,你只需要知道「&」代表 AND,而「|」代表 Python OR。

8.2K20

图解pandas模块21个常用操作

2、从ndarray创建一个系列 如果数据是ndarray,传递索引必须具有相同长度。...3、从字典创建一个系列 字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引与标签对应数据将被拉出。 ?...你可以把它想象成一个电子表格或SQL表,或者 Series 对象字典。一般是最常用pandas对象。 ? ?...11、返回指定行列 pandasDataFrame非常方便提取数据框内数据。 ? 12、条件查询 对各类数值型、文本型,单条件和多条件进行行选择 ? ?...18、查找替换 pandas提供简单查找替换功能,如果要复杂查找替换,可以使用map(), apply()和applymap() ?

8.5K12

几个高效Pandas函数

Pandas是python中最主要数据分析库之一,提供了非常多函数、方法,可以高效地处理并分析数据。让pandas如此受欢迎原因是简洁、灵活、功能强大语法。...Where Where用来根据条件替换行或列如果满足条件,保持原来,不满足条件替换为其他。默认替换为NaN,也可以指定特殊。..., raise_on_error=None) 参数作用: cond:布尔条件如果 cond 为真,保持原来,否则替换为other other:替换特殊 inplace:inplace为真则在原数据上操作...; deep:如果为True,通过查询object类型进行系统级内存消耗来深入地检查数据,并将其包括在返回。...15. replace 顾名思义,replace是用来替换df,赋以新

1.5K60

PythonPandas相关操作

2.DataFrame(数据框):DataFramePandas二维表格数据结构,类似于电子表格或SQL表。由行和列组成,每列可以包含不同数据类型。...每个Series和DataFrame对象都有一个默认整数索引,也可以自定义索引。 4.选择和过滤数据:Pandas提供了灵活方式来选择、过滤和操作数据。...可以使用标签、位置、条件等方法来选择特定行和列。 5.缺失数据处理:Pandas具有处理缺失数据功能,可以检测、删除或替换数据缺失。...6.数据聚合和分组:Pandas可以通过分组和聚合操作对数据进行统计和汇总。支持常见统计函数,如求和、均值、最大、最小等。...7.数据排序和排名:Pandas提供了对数据进行排序和排名功能,可以按照指定列或条件对数据进行排序,并为每个元素分配排名。

24030

Pandas 2.2 中文官方教程和指南(一)

检查您遇到错误是否在上一个版本修复。 开发版本通常每天上传到 anaconda.org PyPI 注册表 scientific-python-nightly-wheels 索引。...安装 pandas 开发版本 安装开发版本是最快方式: 尝试一个将在下一个版本中发布新功能(即,最近合并到主分支拉取请求功能)。 检查您遇到错误是否自上次发布以来修复。...使用 Python 字典列表时,字典键将用作列标题,每个列表将用作DataFrame列。...一个DataFrame是一个可以在列存储不同类型数据(包括字符、整数、浮点、分类数据等)二维数据结构。 类似于电子表格、SQL 表或 R data.frame。...当使用 Python 字典列表时,字典键将被用作列标题,每个列表将作为 DataFrame 列。

24510

针对SAS用户:Python数据分析库pandas

本文包括主题: 导入包 Series DataFrames 读.csv文件 检查 处理缺失数据 缺失数据监测 缺失替换 资源 pandas简介 本章介绍pandas库(或包)。...检查 pandas有用于检查数据方法。DataFrame.head()方法默认显示前5行。.tail()方法默认显示最后5行。行计数值可以是任意整数值,如: ?...缺失识别 回到DataFrame,我们需要分析所有列缺失Pandas提供四种检测和替换缺失方法。...5 rows × 27 columns 缺失替换 下面的代码用于并排呈现多个对象。来自Jake VanderPlas使用数据基本工具。显示对象更改“前”和“后”效果。 ?...在这种情况下,行"d"被删除,因为只包含3个非空。 ? ? 可以插入或替换缺失,而不是删除行和列。.fillna()方法返回替换Series或DataFrame

12.1K20

Pandas内存优化和数据加速读取

pandas 内部将数值表示为 NumPy ndarrays,因为 pandas 表示同一类型每个时都使用同样字节数,而 NumPy ndarray 可以存储数量,所以 pandas 可以快速准确地返回一个数值列所消耗字节数...OK,这就是有时候DataFrame内存占用过高原因。 所以这里有个简单思路是:我依次去遍历数据所有列,检查每一列数值范围包含在哪个最近子类区间。...你可以在此处执行一项非常有用操作是预处理,然后将数据存储在处理表单,以便在需要时使用。但是,如何以正确格式存储数据而无需再次重新处理?...如果你要另存为CSV,只会丢失datetimes对象,并且在再次访问时必须重新处理。...Pandas HDFStore 类允许你将DataFrame存储在HDF5文件,以便可以有效地访问,同时仍保留列类型和其他元数据。

2.6K20
领券