首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

总结了67个pandas函数,完美解决数据处理,拿来即用!

导⼊数据 导出数据 查看数据 数据选取 数据处理 数据分组排序 数据合并 # 在使用之前,需要导入pandas库 import pandas as pd 导⼊数据 这里我为大家总结7个常见用法。...pd.DataFrame() # 自己创建数据框,用于练习 pd.read_csv(filename) # CSV⽂件导⼊数据 pd.read_table(filename) # 限定分隔符⽂...pd.read_json(json_string) # JSON格式字符串导⼊数据 pd.read_html(url) # 解析URL、字符串或者HTML⽂件,抽取其中tables表格 导出数据...df.head(n) # 查看DataFrame对象前n⾏ df.tail(n) # 查看DataFrame对象最后n⾏ df.shape() # 查看⾏ df.info() # 查看索引...Series对象唯⼀计数 df.apply(pd.Series.value_counts) # 查看DataFrame对象中每⼀列唯⼀计数 df.isnull().any() # 查看是否有缺失

3.5K30
您找到你想要的搜索结果了吗?
是的
没有找到

Pandas 秘籍:1~5

重命名行列名创建和删除列 介绍 本章目的是通过彻底检查序列和数据数据结构来介绍 Pandas 基础。...在本章中,您将学习如何数据中选择一个数据列,该数据列将作为序列返回。 使用此一维对象可以轻松显示不同方法运算符如何工作。 许多序列方法返回另一个序列作为输出。...通常,这些新列将从数据集中已有的先前列创建Pandas 有几种不同方法可以向数据添加新列。 准备 在此秘籍中,我们通过使用赋值在影片数据集中创建新列,然后使用drop方法删除列。...shape属性返回行两个元素元组。size属性返回数据中元素总数,它只是行乘积。ndim属性返回维,对于所有数据,维均为 2。...第 9 步使用列表推导式遍历所有所需列名,以使用索引方法get_loc查找其整数位置。 更多 实际上,可以将数组布尔列表传递给序列对象,这些对象长度与您要建立索引数据长度不同

37.2K10

Python常用小技巧总结

others Python合并多个EXCEL工作表 pandas中SeriesDataframe数据类型互转 相同字段合并 Python小技巧 简单表达式 列表推导式 交换变量 检查对象使用内存情况...pd.DataFrame() # 自己创建数据框,用于练习 pd.read_csv(filename) # CSV⽂件导⼊数据 pd.read_table(filename) # 限定分隔符...pd.read_json(json_string) # JSON格式字符串导⼊数据 pd.read_html(url) # 解析URL、字符串或者HTML⽂件,抽取其中tables表格 导出数据...对象前n⾏ df.tail(n) # 查看DataFrame对象最后n⾏ df.shape() # 查看⾏ df.info() # 查看索引、数据类型内存信息 df.columns...–replace正则 分享pandas数据清洗技巧,在某列山使用replace正则快速完成清洗 d = {"customer": ["A", "B", "C", "D"], "sales

9.4K20

Pandas 学习手册中文第二版:1~5

pandas 统计编程语言 R 中带给 Python 许多好处,特别是数据对象 R 包(例如plyrreshape2),并将它们放置在一个可在内部使用 Python 库中。...这些列是数据中包含新Series对象,具有原始Series对象复制。 可以使用带有列名列名列表数组索引器[]访问DataFrame对象列。...代替单个序列,数据每一行可以具有多个,每个都表示为一列。 然后,数据每一行都可以对观察对象多个相关属性进行建模,并且每一列都可以表示不同类型数据。...具体而言,在本章中,我们将涵盖以下主题: 根据 Python 对象,NumPy 函数,Python 字典,Pandas Series对象 CSV 文件创建DataFrame 确定数据大小 指定操作数据列名...在创建数据时未指定列名称时,pandas 使用 0 开始增量整数来命名列。

8.1K10

Pandas DataFrame创建方法大全

创建Pandas数据六种方法如下: 创建空DataFrame 手工创建DataFrame 使用List创建DataFrame 使用Dict创建DataFrme 使用Excel文件创建DataFrame...2、手工创建Pandas DataFrame 接下来让我们看看如何使用pd.DataFrame手工创建一个Pandas数据: df = pd.DataFrame(data=['Apple','Banana...由于我们没有定义数据列名,因此Pandas默认使用序号作为列名。...4、使用字典创建Pandas DataFrame 字典就是一组键/对: dict = {key1 : value1, key2 : value2, key3 : value3} 当我们将上述字典对象转换为...由于列名为Fruits、QuantityColor,因此对应字典也应当 有这几个键,而每一行则对应字典中键值,字典应该是 如下结构: fruits_dict = { 'Fruits':['Apple

5.7K20

pandas入门①数据统计

使用如下缩写: df:任意Pandas DataFrame对象 s:任意Pandas Series对象 创建数据 # -*- coding: utf-8 -*- """ Created on...):Excel文件导入数据 pd.read_sql(query, connection_object):SQL表/库导入数据 pd.read_json(json_string):JSON格式字符串导入数据...(dict):字典对象导入数据,Key是列名,Value是数据 常用查看、检查数据函数 df.head(n):查看DataFrame对象前n行 df.tail(n):查看DataFrame对象最后...n行 df.index 查看行名 df.columns 查看列名 df.values 查看矩阵 df.shape():查看行数 df.info():查看索引、数据类型内存信息 df.describe...对象中每一列唯一计数 数据排序 df.sort_index(axis=1, ascending=False) # 即按列名排序,交换列位置。

1.5K20

Pandas速查手册中文版

pandas-cheat-sheet.pdf 关键缩写包导入 在这个速查手册中,我们使用如下缩写: df:任意Pandas DataFrame对象 同时我们需要做如下引入: import pandas...):Excel文件导入数据 pd.read_sql(query, connection_object):SQL表/库导入数据 pd.read_json(json_string):JSON格式字符串导入数据...文件 df.to_sql(table_name, connection_object):导出数据到SQL表 df.to_json(filename):以Json格式导出数据到文本文件 创建测试对象 pd.DataFrame...(np.random.rand(20,5)):创建20行5列随机数组成DataFrame对象 pd.Series(my_list):可迭代对象my_list创建一个Series对象 df.index...(n):查看DataFrame对象最后n行 df.shape():查看行数 http:// df.info() :查看索引、数据类型内存信息 df.describe():查看数值型列汇总统计

12.1K92

Pandas 秘籍:6~11

检查索引对象 如第 1 章,“Pandas 基础”中所讨论,序列和数据每个轴都有一个索引对象,用于标记。 有许多不同类型索引对象,但是它们都具有相同共同行为。...准备 在本秘籍中,我们使用groupby方法执行聚合,以创建具有行列多重索引数据,然后对其进行处理,以使索引为单个级别,并且列名具有描述性。...请注意,当我们拆开数据时,pandas 会保留原始列名(在这里,它只是一个列Value),并创建一个以旧列名为上层多重索引。...即使所得latitudelongitude列似乎是浮点数,也并非如此。 它们最初是对象列进行解析,因此仍然是对象数据类型。 步骤 3 使用字典将列名称映射到其新类型。...该groupby对象与控制绘图颜色线条样式一起压缩。 我们 matplotlib 导入了调色板模块cm,该模块包含数十种不同调色板。

33.8K10

妈妈再也不用担心我忘记pandas操作了

Json格式导出数据到文本文件 创建测试对象: pd.DataFrame(np.random.rand(20,5)) # 创建20行5列随机数组成DataFrame对象 pd.Series(my_list...、检查数据: df.head(n) # 查看DataFrame对象前n行 df.tail(n) # 查看DataFrame对象最后n行 df.shape() # 查看行数 df.info()...# 查看索引、数据类型内存信息 df.describe()# 查看数值型列汇总统计 s.value_counts(dropna=False) # 查看Series对象唯一计数 df.apply...(pd.Series.value_counts) # 查看DataFrame对象中每一列唯一计数 数据选取: df[col] # 根据列名,并以Series形式返回列 df[[col1, col2...操作上千种,但对于数据分析使用掌握常用操作就可以应付了,更多操作可以参考pandas官网。

2.2K31

python数据分析——数据选择运算

数据获取 ①列索引取值 使用单个或序列,可以DataFrame中索引出一个或多个列。...1.使用merge()方法合并数据Pandas提供了一个函数merge,作为DataFrame对象之间所有标准数据库连接操作入口点。...True表示按连结主键(on 对应列名)进行升序排列。 【例】创建两个不同数据,并使用merge()对其执行合并操作。 关键技术:merge()函数 首先创建两个DataFrame对象。...代码输出结果如下所示: (2)使用多个键合并两个数据: 关键技术:使用’ id’键及’subject_id’键合并两个数据,并使用merge()对其执行合并操作。...用于其他(n-1)轴特定索引,而不是执行内部/外部设置逻辑。 【例】使用Concat连接对象。 关键技术: concat函数执行沿轴执行连接操作所有工作,可以让我们创建不同对象并进行连接。

12510

pandas技巧4

本文中记录Pandas操作技巧,包含: 导入数据 导出数据 查看、检查数据 数据选取 数据清洗 数据处理:Filter、SortGroupBy 数据合并 常识 # 导入pandas import pandas...(json_string) # JSON格式字符串导入数据 pd.read_html(url) # 解析URL、字符串或者HTML文件,抽取其中tables表格 pd.read_clipboard...() # 粘贴板获取内容,并传给read_table() pd.DataFrame(dict) # 字典对象导入数据,Key是列名,Value是数据 导出数据 df.to_csv(filename...to_excel(writer,sheet_name='单位') writer.save(),将多个数据写入同一个工作簿多个sheet(工作表) 查看、检查数据 df.head(n) # 查看DataFrame...对象前n行 df.tail(n) # 查看DataFrame对象最后n行 df.shape() # 查看行数 df.info() # 查看索引、数据类型内存信息 df.columns() #

3.4K20

如何在 Pandas创建一个空数据并向其附加行列?

Pandas是一个用于数据操作和分析Python库。它建立在 numpy 库之上,提供数据有效实现。数据是一种二维数据结构。在数据中,数据以表格形式在行列中对齐。...它类似于电子表格或SQL表或R中data.frame。最常用熊猫对象数据。大多数情况下,数据其他数据源(如csv,excel,SQL等)导入到pandas数据。...在本教程中,我们将学习如何创建一个空数据,以及如何在 Pandas 中向其追加行列。...Pandas.Series 方法可用于列表创建系列。列也可以作为列表传递,而无需使用 Series 方法。 例 1 在此示例中,我们创建了一个空数据。...Python 中 Pandas 库创建一个空数据以及如何向其追加行列。

20230

Pandas profiling 生成报告并部署一站式解决方案

它为数据集提供报告生成,并为生成报告提供许多功能自定义。在本文中,我们将探索这个库,查看提供所有功能,以及一些高级用例集成,这些用例集成可以对数据创建令人惊叹报告!...可以将DataFrame对象传递给profiling函数,然后调用创建函数对象以开始生成分析文件。 无论采用哪种方式,都将获得相同输出报告。我正在使用第二种方法为导入农业数据集生成报告。...变量 报告这一部分详细分析了数据所有变量/列/特征。显示信息因变量数据类型而异。 数值变量 对于数值数据类型特征,可以获得有关不同、缺失、最小-最大、平均值负值计数信息。...字符串类型概览选项卡显示最大-最小中值平均长度、总字符、不同字符、不同类别、唯一来自数据样本。 类别选项卡显示直方图,有时显示特征计数饼图。该表包含、计数百分比频率。...计数图是一个基本条形图,以 x 轴作为列名,条形长度代表存在数量(没有空)。类似的还有矩阵树状图。 5. 样本 此部分显示数据前 10 行最后 10 行。 如何保存报告?

3.2K10

图解pandas模块21个常用操作

2、ndarray创建一个系列 如果数据是ndarray,则传递索引必须具有相同长度。...3、字典创建一个系列 字典(dict)可以作为输入传递,如果没有指定索引,则按排序顺序取得字典键以构造索引。如果传递了索引,索引中与标签对应数据将被拉出。 ?...5、序列聚合统计 Series有很多聚会函数,可以方便统计最大、求和、平均值等 ? 6、DataFrame(数据) DataFrame是带有标签二维数据结构,列类型可能不同。...7、列表创建DataFrame 列表中很方便创建一个DataFrame,默认行列索引0开始。 ?...18、查找替换 pandas提供简单查找替换功能,如果要复杂查找替换,可以使用map(), apply()applymap() ?

8.5K12

20个能够有效提高 Pandas数据分析效率常用函数,附带解释例子

当我们需要添加在任意位置,则可以使用 insert 函数。使用该函数只需要指定插入位置、列名称、插入对象数据。...这样得到累积在某些情况下意义不大,因为我们更需要不同小组累计数据。对于这个问题有一个非常简单方便解决方案,我们可以同时应用groupbycumsum函数。...Isin 在处理数据时,我们经常使用过滤或选择方法。Isin是一种先进筛选方法。例如,我们可以根据选择列表筛选数据。...对于行标签,如果我们不分配任何特定索引,pandas默认创建整数索引。因此,行标签是0开始向上整数。与iloc一起使用行位置也是0开始整数。...Infer_objects Pandas支持广泛数据类型,其中之一就是object。object包含文本或混合(数字非数字)。但是,如果有其他选项可用,则不建议使用对象数据类型。

5.5K30

Pandas 学习手册中文第二版:6~10

PeriodIndex 设置重置索引 创建分层索引 使用分层索引选择数据 配置 Pandas 我们 Pandas 标准配置开始,但是我们也加载了 S&P 500 数据,以供几个示例使用。...具体来说,我们将检查: 对序列或数据创建使用索引 用索引选择方法 在索引之间移动数据 重新索引 Pandas 对象 对序列或数据创建使用索引 索引可以显式创建,也可以让 Pandas 隐式创建...两个DataFrame对象之间算术运算将同时按列标签索引标签对齐。 以下代码提取了df一小部分,并将其完整数据中减去。...Pandas 已经意识到,文件第一行包含列名数据中批量读取到数据名称。 读取 CSV 文件时指定索引列 在前面的示例中,索引是数字0开始,而不是按日期。...我们学习如何 CSV,HTML,JSON,HDF5 Excel 格式本地文件中读取写入数据开始,直接读取写入数据对象,而不必担心将包含数据映射到这些各种数据细节。 格式。

2.2K20
领券