首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python数据分析-pandas库入门

Contents 1 pandas 库概述 2 安装 pandas 3 pandas使用 4 pandas数据结构介绍 4.1 Series数据结构 4.2 DataFrame数据结构 4.3 索引对象...使用 NumPy 函数或类似 NumPy 运算(根据布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引链接,代码示例: obj2*2 np.exp(obj2) 还可以将 Series...DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成字典(共用同一个索引)。DataFrame 数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...虽然 DataFrame 是以二维结构保存数据,但你仍然可以轻松地将其表示为更高维度数据(层次化索引表格型结构,这是 pandas许多高级数据处理功能关键要素 ) 创建 DataFrame 办法有很多...(pop,columns=['Nvidia','Intel']) frame3 表5-1列出了DataFrame构造函数所能接受各种数据 索引对象 pandas 索引对象负责管理标签和其他元数据

3.7K20

Python 数据处理:Pandas使用

DataFrame既有行索引也有列索引,它可以被看做由Series组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...Pandas 索引对象负责管理标签和其他元数据(比如名称等)。...Index会被完全使用,就像没有任何复制一样 method 插值(填充)方式 fill_value 在重新索引过程,需要引入缺失值时使用替代值 limit 前向或后向填充时最大填充量 tolerance...它们可以让你用类似 NumPy 标记,使用标签(loc)或整数索引(iloc),从DataFrame选择行和列子集。...) ---- 2.7 在算术方法填充值 在对不同索引对象进行算术运算时,你可能希望当一个对象某个标签在另一个对象找不到时填充一个特殊值(比如0): import pandas as pd

22.7K10
您找到你想要的搜索结果了吗?
是的
没有找到

pandas | DataFrame排序与汇总方法

大家好,我是架构君,一个会写代码吟诗架构师。今天说一说pandas | DataFrame排序与汇总方法,希望能够帮助大家进步!!!...Series当中排序方法有两个,一个是sort_index,顾名思义根据Series索引对这些值进行排序。另一个是sort_values,根据Series值来排序。...但是由于DataFrame是一个二维数据,所以在使用上会有些不同。...最简单差别是在于Series只有一列,我们明确知道排序对象,但是DataFrame不是,它当中索引就分为两种,分别是行索引以及列索引。...所以我们在排序时候需要指定我们想要排序,也就是axis。 默认情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。

3.8K20

pandas | DataFrame排序与汇总方法

在上一篇文章当中我们主要介绍了DataFrame当中apply方法,如何在一个DataFrame对每一行或者是每一列进行广播运算,使得我们可以在很短时间内处理整份数据。...Series当中排序方法有两个,一个是sort_index,顾名思义根据Series索引对这些值进行排序。另一个是sort_values,根据Series值来排序。...但是由于DataFrame是一个二维数据,所以在使用上会有些不同。...最简单差别是在于Series只有一列,我们明确知道排序对象,但是DataFrame不是,它当中索引就分为两种,分别是行索引以及列索引。...所以我们在排序时候需要指定我们想要排序,也就是axis。 默认情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。 ?

4.5K50

Python之数据规整化:清理、转换、合并、重塑

合并数据集 pandas.merge可根据一个或者多个不同DataFrame行连接起来。 pandas.concat可以沿着一条将多个对象堆叠到一起。...pd.merge(df1,df2,on='key') 2.2 默认情况下,merge做是"inner"连接,结果键是交集。其他方式有“left”、“right”、“outer”。...4.1 重塑层次化索引 层次化索引DataFrame数据重排任务提供了良好一致性方式。主要两种功能: stack:将数据列“旋转”为行。...5.2 替换值 replace可以由一个带替换值组成列表以及一个替换值 data.replace([-999,-1000],np.nan) 5.3 重命名轴索引 标签也可通函数或映射进行转换,从而得到一个新对象还可以被就地修改...实现矢量化元素获取操作:要么使用str.get,要么使用str属性上使用索引

3K60

Python之PandasSeries、DataFrame实践

2. pandas数据结构DataFrame是一个表格型数据结构,它含有一组有序列,每列可以是不同值类型(数值、字符串、布尔值)。...dataframe数据是以一个或者多个二位块存放(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas索引对象负责管理标签和其他元素(比如名称等)。...操作Series和DataFrame数据基本手段 5.1 重新索引 reindex 5.2 丢弃指定项 drop 5.3 索引、选取和过滤(.ix) 5.4 算数运算和数据对齐 DataFrame...排序和排名 要对行或列索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个已排序新对象;对于DataFrame,则可以根据任意一个索引进行排序。 8....处理缺失数据(Missing data) 9.1 pandas使用浮点值NaN(Not a Number)表示浮点和非浮点数组缺失数据。

3.9K50

猿创征文|数据导入与预处理-第3章-pandas基础

pandas可以使用[]、loc、iloc、at和iat这几种方式访问Series类对象和DataFrame类对象数据。...使用at和iat访问数据 pandas还可以使用at和iat访问数据,与前两种方式相比,这种方式可以访问DataFrame类对象单个数据。...1.5.3.2 使用分层索引访问数据 掌握分层索引使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象数据 pandas除了可以通过简单单层索引访问数据外,...与单层索引相比,分层索引只适用于[]、loc和iloc,且用法大致相同。 使用[]访问数据 由于分层索引索引层数比单层索引多,在使用[]方式访问数据时,需要根据不同需求传入不同层级索引。...变量[第一层索引] 变量[第一层索引][第二层索引] 以上方式使用 变量[第一层索引] 可以访问第一层索引嵌套第二层索引及其对应数据; 使用 变量[第一层索引][第二层索引] 可以访问第二层索引对应数据

13.9K20

详解pd.DataFrame几种索引变换

惯例开局一张图 01 索引简介与样例数据 Series和DataFramepandas主要数据结构类型(老版本中曾有三维数据结构Panel,是DataFrame容器,后被取消),而二者相较于传统数组或...,均支持两种变换方式: 一种是变换内容+axis指定作用(可选0/1或index/columns); 另一种是直接用index/columns关键字指定作用 具体而言,reindex执行索引重组操作...对于前面介绍示例数据df,以重组行索引为例,两种可选方式为: ?...03 index.map 针对DataFrame数据,pandas中提供了一对功能有些相近接口:map和apply,以及applymap,其中map仅可用于DataFrame一列(也即即Series...也就是说,三者最大不同在于作用范围以及变换方式不同。 实际上,apply和map还有一个细微区别在于:同样是可作用于单列对象,apply适用于索引这种特殊单列,而map则不适用。

2.2K20

《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

DataFrame既有行索引也有列索引,它可以被看做由Series组成字典(共用同一个索引)。DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...pandas索引对象负责管理标签和其他元数据(比如名称等)。...它们可以让你用类似NumPy标记,使用标签(loc)或整数索引(iloc),从DataFrame选择行和列子集。...表5-4 DataFrame索引选项 整数索引 处理整数索引pandas对象常常难住新手,因为它与Python内置列表和元组索引语法不同。...在对不同索引对象进行算术运算时,你可能希望当一个对象某个标签在另一个对象找不到时填充一个特殊值(比如0): In [165]: df1 = pd.DataFrame(np.arange(12.

6K70

Python数据分析 | Pandas数据变换高级函数

一、Pandas数据变换高级函数 ----------------- 在数据处理过程,经常需要对DataFrame进行逐行、逐列和逐元素操作(例如,机器学习特征工程阶段)。...对于这两种方式,map都是把对应数据逐个当作参数传入到字典或函数,进行映射得到结果。...掌握DataFrameapply方法需要先了解一下axis概念,在DataFrame对象大多数方法,都会有axis这个参数,它控制了你指定操作是沿着0还是1进行。...(Series索引为列名)传入指定函数,返回相应结果。...3.2 applymap方法 applymap是另一个DataFrame可能会用到方法,它会对DataFrame每个单元格执行指定函数操作,如下例所示: df = pd.DataFrame(

1.3K31

pandas入门:Series、DataFrame、Index基本操作都有了!

pandas应用领域广泛,包括金融、经济、统计、分析等学术和商业领域。本文将介绍pandasSeries、DataFrame、Index等常用类基本用法。...作者:李明江 张良均 周东平 张尚佳 来源:大数据DT(ID:hzdashuju) pandas提供了众多类,可满足不同使用需求,其中常用类如下所示。...更新、插入和删除 更新Series方法十分简单,采用赋值方式对指定索引标签(或位置)对应数据进行修改即可,代码清单6-8所示。...若只在原Series上插入单个值,则采用赋值方式即可,代码清单6-9所示。...对象为其余pandas对象存储标签、管理标签和其他元数据(名称)。

4.3K30

数据导入与预处理-课程总结-01~03章

: 同名异义:数据源A属性ID和数据源B属性ID分别描述是菜品编号和订单编号,即描述不同实体。...pandas可以使用[]、loc、iloc、at和iat这几种方式访问Series类对象和DataFrame类对象数据。...使用at和iat访问数据 pandas还可以使用at和iat访问数据,与前两种方式相比,这种方式可以访问DataFrame类对象单个数据。...使用分层索引访问数据 掌握分层索引使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象数据 pandas除了可以通过简单单层索引访问数据外,还可以通过复杂分层索引访问数据...与单层索引相比,分层索引只适用于[]、loc和iloc,且用法大致相同。 使用[]访问数据 由于分层索引索引层数比单层索引多,在使用[]方式访问数据时,需要根据不同需求传入不同层级索引

2.9K20

Pandas系列 - 基本数据结构

标签统称为索引 一、pandas.Series 构造函数 pandas.Series(data, index, dtype, copy) 编号 参数 描述 1 data 数据采取各种形式,:ndarray...s 0 5 1 5 2 5 3 5 dtype: int64 ---- 二、pandas.DataFrame 数据帧(DataFrame)是二维数据结构,即数据以行和列表格方式排列...数据帧(DataFrame)功能特点: 潜在列是不同类型 大小可变 标记(行和列) 可以对行和列执行算术运算 构造函数: pandas.DataFrame(data, index, columns...df.append(df2) print df 删除行 drop 使用索引标签从DataFrame删除或删除行。...() 面板(Panel)是3D容器数据 3(axis)这个名称旨在给出描述涉及面板数据操作一些语义 details items axis 0,每个项目对应于内部包含数据帧(DataFrame

5.1K20

上手Pandas,带你玩转数据(1)-- 实例详解pandas数据结构

经常用在金融应用。 3.数据队列。可以把不同队列数据进行基本运算。 4.处理缺失数据。 5.分组运算。比如我们在前面泰坦尼克号groupby。 6.分级索引。...Pandas序列可以使用以下构造函数创建: pandas.Series( data, index, dtype, copy) 参数释义: data:数据采取各种形式,:ndarray,list,constants...如果 索引 被传递, 索引 标签对应数据值将被取出。...= df.append(df2) print(df) a b 0 1 2 1 3 4 0 5 6 1 7 8 ---- 行删: 使用索引标签从DataFrame删除或删除行...---- DataFrame基本方法 属性或方法 描述 Ť 转置行和列。 axes 以行标签和列标签作为唯一成员返回列表。 dtypes 返回此对象dtypes。

6.7K30

Python 数据分析(PYDA)第三版(四)

对象包含数据可以以多种方式组合: pandas.merge 基于一个或多个键连接 DataFrame 行。...注意 当您在列上进行列连接时,传递 DataFrame 对象索引会被丢弃。如果需要保留索引值,可以使用reset_index将索引附加到列。 合并操作要考虑最后一个问题是处理重叠列名方式。...特别是,您有许多额外考虑: 如果对象在其他索引不同,我们应该合并这些不同元素还是仅使用共同值? 连接数据块在结果对象需要被识别吗? “连接包含需要保留数据吗?...它们可以以两种方式使用: 不带参数调用返回当前参数值(例如,ax.xlim()返回当前 x 绘图范围) 带参数调用设置参数值(例如,ax.xlim([0, 10])将 x 范围设置为 0 到...DataFrame 有许多选项,允许对列处理方式进行一定灵活性,例如,是否将它们全部绘制在同一个子图上,还是创建单独子图。更多信息请参见 表 9.4。

24300

Pandas光速入门-一文掌握数据操作

可以支持从各种格式文件中导入数据,比如CSV、EXCEL、JSON、SQL等,并提供了两种数据结构Series和DataFrame,可以方便对数据进行操作运算清洗加工等。...Python环境搭建-从安装到Hello World 安装 ---- 如果使用pip安装: pip install pandas 如果使用conda安装: conda install pandas 如果使用是...DataFrame DataFrame表示二维数据,即二维数组,或表格。是由若干列Series组成,每列数据类型可以不同。...使用函数pandas.DataFrame(data, index, columns, dtype, copy)创建,data和index参数同Series,columns是列名,其实对应Series...axis默认0表示以行为连接,为1表示以列为连接;level指定多层索引组;dropna默认True删除含NA行和列,为False则不删NA行列。

1.9K40

Pandas DataFrame 自连接和交叉连接

在 SQL 中经常会使用JOIN操作来组合两个或多个表。有很多种不同种类 JOINS操作,并且pandas 也提供了这些方式实现来轻松组合 Series 或 DataFrame。...SQL语句提供了很多种JOINS 类型: 内连接 外连接 全连接 自连接 交叉连接 在本文将重点介绍自连接和交叉连接以及如何在 Pandas DataFrame 中进行操作。...自连接 顾名思义,自连接是将 DataFrame 连接到自己连接。也就是说连接左边和右边都是同一个DataFrame 。自连接通常用于查询分层数据集或比较同一 DataFrame 行。...这个示例数据种两个 DataFrame 都没有索引所以使用 pandas.merge() 函数很方便。...总结 在本文中,介绍了如何在Pandas使用连接操作,以及它们是如何在 Pandas DataFrame 执行。这是一篇非常简单入门文章,希望在你处理数据时候有所帮助。

4.2K20

pandas入门教程

我已经将本文源码和测试数据放到Github上: pandas_tutorial ,读者可以前往获取。 另外,pandas常常和NumPy一起使用,本文中源码也会用到NumPy。...这两种类型数据结构对比如下: ? DataFrame可以看做是Series容器,即:一个DataFrame可以包含若干个Series。...这段输出说明如下: 输出最后一行是Series数据类型,这里数据都是int64类型。 数据在第二列输出,第一列是数据索引,在pandas称之为Index。...请注意: DataFrame不同列可以是不同数据类型 如果以Series数组来创建DataFrame,每个Series将成为一行,而不是一列 例如: ? df4输出如下: ?...我们可以通过下面的形式给DataFrame添加或者删除列数据: ? 这段代码输出如下: ? Index对象与数据访问 pandasIndex对象包含了描述元数据信息。

2.2K20
领券