Contents 1 pandas 库概述 2 安装 pandas 3 pandas 库使用 4 pandas数据结构介绍 4.1 Series数据结构 4.2 DataFrame数据结构 4.3 索引对象...使用 NumPy 函数或类似 NumPy 的运算(如根据布尔型数组进行过滤、标量乘法、应用数学函数等)都会保留索引值的链接,代码示例: obj2*2 np.exp(obj2) 还可以将 Series...DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共用同一个索引)。DataFrame 中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...虽然 DataFrame 是以二维结构保存数据的,但你仍然可以轻松地将其表示为更高维度的数据(层次化索引的表格型结构,这是 pandas中许多高级数据处理功能的关键要素 ) 创建 DataFrame 的办法有很多...(pop,columns=['Nvidia','Intel']) frame3 表5-1列出了DataFrame构造函数所能接受的各种数据 索引对象 pandas 的索引对象负责管理轴标签和其他元数据
DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...Pandas 的索引对象负责管理轴标签和其他元数据(比如轴名称等)。...Index会被完全使用,就像没有任何复制一样 method 插值(填充)方式 fill_value 在重新索引的过程中,需要引入缺失值时使用的替代值 limit 前向或后向填充时的最大填充量 tolerance...它们可以让你用类似 NumPy 的标记,使用轴标签(loc)或整数索引(iloc),从DataFrame选择行和列的子集。...) ---- 2.7 在算术方法中填充值 在对不同索引的对象进行算术运算时,你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值(比如0): import pandas as pd
大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说pandas | DataFrame中的排序与汇总方法,希望能够帮助大家进步!!!...Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。...但是由于DataFrame是一个二维的数据,所以在使用上会有些不同。...最简单的差别是在于Series只有一列,我们明确的知道排序的对象,但是DataFrame不是,它当中的索引就分为两种,分别是行索引以及列索引。...所以我们在排序的时候需要指定我们想要排序的轴,也就是axis。 默认的情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。
在上一篇文章当中我们主要介绍了DataFrame当中的apply方法,如何在一个DataFrame对每一行或者是每一列进行广播运算,使得我们可以在很短的时间内处理整份数据。...Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。...但是由于DataFrame是一个二维的数据,所以在使用上会有些不同。...最简单的差别是在于Series只有一列,我们明确的知道排序的对象,但是DataFrame不是,它当中的索引就分为两种,分别是行索引以及列索引。...所以我们在排序的时候需要指定我们想要排序的轴,也就是axis。 默认的情况我们是根据行索引进行排序,如果我们要指定根据列索引进行排序,需要传入参数axis=1。 ?
合并数据集 pandas.merge可根据一个或者多个不同DataFrame中的行连接起来。 pandas.concat可以沿着一条轴将多个对象堆叠到一起。...pd.merge(df1,df2,on='key') 2.2 默认情况下,merge做的是"inner"连接,结果中的键是交集。其他方式有“left”、“right”、“outer”。...4.1 重塑层次化索引 层次化索引为DataFrame数据的重排任务提供了良好的一致性方式。主要两种功能: stack:将数据的列“旋转”为行。...5.2 替换值 replace可以由一个带替换值组成的列表以及一个替换值 data.replace([-999,-1000],np.nan) 5.3 重命名轴索引 轴标签也可通函数或映射进行转换,从而得到一个新对象轴还可以被就地修改...实现矢量化的元素获取操作:要么使用str.get,要么使用str属性上使用索引。
2. pandas的数据结构DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值的)。...dataframe中的数据是以一个或者多个二位块存放的(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas的索引对象负责管理轴标签和其他元素(比如轴名称等)。...操作Series和DataFrame中的数据的基本手段 5.1 重新索引 reindex 5.2 丢弃指定轴上的项 drop 5.3 索引、选取和过滤(.ix) 5.4 算数运算和数据对齐 DataFrame...排序和排名 要对行或列索引进行排序(按字典顺序),可使用sort_index方法,它将返回一个已排序的新对象;对于DataFrame,则可以根据任意一个轴上的索引进行排序。 8....处理缺失数据(Missing data) 9.1 pandas使用浮点值NaN(Not a Number)表示浮点和非浮点数组中的缺失数据。
简单介绍 pandas 是专为 python 编程语言设计的高性能,简单易用的数据结构和数据分析工具库,它建立在 numpy 之上,可以许多第三方库完美集成在同一个科学计算环境中。...pandas 被广泛应用于金融,统计,社会科学和许多工程技术领域,处理典型数据分析案例。 2. 安装 pandas 支持 conda 和 pip 两种方式安装。...数据结构 pandas 有两种主要的数据结构:Series(1维)和 DataFrame (2维)。...import pandas as pd 3.1 Series Series 是一维标记数组,能够保存任何数据类型(整数,字符串,浮点数,Python对象等)。 轴标签统称为索引。...,具有可能不同类型的列。
pandas中可以使用[]、loc、iloc、at和iat这几种方式访问Series类对象和DataFrame类对象的数据。...使用at和iat访问数据 pandas中还可以使用at和iat访问数据,与前两种方式相比,这种方式可以访问DataFrame类对象的单个数据。...1.5.3.2 使用分层索引访问数据 掌握分层索引的使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象的数据 pandas中除了可以通过简单的单层索引访问数据外,...与单层索引相比,分层索引只适用于[]、loc和iloc,且用法大致相同。 使用[]访问数据 由于分层索引的索引层数比单层索引多,在使用[]方式访问数据时,需要根据不同的需求传入不同层级的索引。...变量[第一层索引] 变量[第一层索引][第二层索引] 以上方式中,使用 变量[第一层索引] 可以访问第一层索引嵌套的第二层索引及其对应的数据; 使用 变量[第一层索引][第二层索引] 可以访问第二层索引对应的数据
惯例开局一张图 01 索引简介与样例数据 Series和DataFrame是pandas中的主要数据结构类型(老版本中曾有三维数据结构Panel,是DataFrame的容器,后被取消),而二者相较于传统的数组或...,均支持两种变换方式: 一种是变换内容+axis指定作用轴(可选0/1或index/columns); 另一种是直接用index/columns关键字指定作用轴 具体而言,reindex执行索引重组操作...对于前面介绍的示例数据df,以重组行索引为例,两种可选方式为: ?...03 index.map 针对DataFrame中的数据,pandas中提供了一对功能有些相近的接口:map和apply,以及applymap,其中map仅可用于DataFrame中的一列(也即即Series...也就是说,三者的最大不同在于作用范围以及变换方式的不同。 实际上,apply和map还有一个细微区别在于:同样是可作用于单列对象,apply适用于索引这种特殊的单列,而map则不适用。
DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...pandas的索引对象负责管理轴标签和其他元数据(比如轴名称等)。...它们可以让你用类似NumPy的标记,使用轴标签(loc)或整数索引(iloc),从DataFrame选择行和列的子集。...表5-4 DataFrame的索引选项 整数索引 处理整数索引的pandas对象常常难住新手,因为它与Python内置的列表和元组的索引语法不同。...在对不同索引的对象进行算术运算时,你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值(比如0): In [165]: df1 = pd.DataFrame(np.arange(12.
一、Pandas的数据变换高级函数 ----------------- 在数据处理过程中,经常需要对DataFrame进行逐行、逐列和逐元素的操作(例如,机器学习中的特征工程阶段)。...对于这两种方式,map都是把对应的数据逐个当作参数传入到字典或函数中,进行映射得到结果。...掌握DataFrame的apply方法需要先了解一下axis的概念,在DataFrame对象的大多数方法中,都会有axis这个参数,它控制了你指定的操作是沿着0轴还是1轴进行。...(Series的索引为列名)传入指定函数,返回相应的结果。...3.2 applymap方法 applymap是另一个DataFrame中可能会用到的方法,它会对DataFrame中的每个单元格执行指定函数的操作,如下例所示: df = pd.DataFrame(
pandas应用领域广泛,包括金融、经济、统计、分析等学术和商业领域。本文将介绍pandas中Series、DataFrame、Index等常用类的基本用法。...作者:李明江 张良均 周东平 张尚佳 来源:大数据DT(ID:hzdashuju) pandas提供了众多类,可满足不同的使用需求,其中常用的类如下所示。...更新、插入和删除 更新Series的方法十分简单,采用赋值的方式对指定索引标签(或位置)对应的数据进行修改即可,如代码清单6-8所示。...若只在原Series上插入单个值,则采用赋值方式即可,如代码清单6-9所示。...对象为其余pandas对象存储轴标签、管理轴标签和其他元数据(如轴名称)。
如: 同名异义:数据源A中的属性ID和数据源B中的属性ID分别描述的是菜品编号和订单编号,即描述的是不同的实体。...pandas中可以使用[]、loc、iloc、at和iat这几种方式访问Series类对象和DataFrame类对象的数据。...使用at和iat访问数据 pandas中还可以使用at和iat访问数据,与前两种方式相比,这种方式可以访问DataFrame类对象的单个数据。...使用分层索引访问数据 掌握分层索引的使用方式,可以通过[]、loc和iloc访问Series类对象和DataFrame类对象的数据 pandas中除了可以通过简单的单层索引访问数据外,还可以通过复杂的分层索引访问数据...与单层索引相比,分层索引只适用于[]、loc和iloc,且用法大致相同。 使用[]访问数据 由于分层索引的索引层数比单层索引多,在使用[]方式访问数据时,需要根据不同的需求传入不同层级的索引。
轴标签统称为索引 一、pandas.Series 构造函数 pandas.Series(data, index, dtype, copy) 编号 参数 描述 1 data 数据采取各种形式,如:ndarray...s 0 5 1 5 2 5 3 5 dtype: int64 ---- 二、pandas.DataFrame 数据帧(DataFrame)是二维数据结构,即数据以行和列的表格方式排列...数据帧(DataFrame)的功能特点: 潜在的列是不同的类型 大小可变 标记轴(行和列) 可以对行和列执行算术运算 构造函数: pandas.DataFrame(data, index, columns...df.append(df2) print df 删除行 drop 使用索引标签从DataFrame中删除或删除行。...() 面板(Panel)是3D容器的数据 3轴(axis)这个名称旨在给出描述涉及面板数据的操作的一些语义 轴 details items axis 0,每个项目对应于内部包含的数据帧(DataFrame
pandas的数据结构 Series Series是一维标记数组,可以存储任意数据类型,如整型、字符串、浮点型和Python对象等,轴标一般指索引。...Series、Numpy中的一维Array、Python基本数据结构List区别:List中的元素可以是不同的数据类型,而Array和Series中则只允许存储相同的数据类型,这样可以更有效的使用内存,...DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。...、选取、过滤 Series索引(obj[...])的工作方式类似于NumPy数组的索引,只不过Series的索引值不只是整数。...numpy as np from pandas import Series, DataFrame print('根据索引排序,对于DataFrame可以指定轴。')
经常用在金融应用中。 3.数据队列。可以把不同队列的数据进行基本运算。 4.处理缺失数据。 5.分组运算。比如我们在前面泰坦尼克号中的groupby。 6.分级索引。...Pandas序列可以使用以下构造函数创建: pandas.Series( data, index, dtype, copy) 参数释义: data:数据采取各种形式,如:ndarray,list,constants...如果 索引 被传递, 索引 中的标签对应的数据值将被取出。...= df.append(df2) print(df) a b 0 1 2 1 3 4 0 5 6 1 7 8 ---- 行删: 使用索引标签从DataFrame中删除或删除行...---- DataFrame基本方法 属性或方法 描述 Ť 转置行和列。 axes 以行轴标签和列轴标签作为唯一成员返回列表。 dtypes 返回此对象中的dtypes。
对象中包含的数据可以以多种方式组合: pandas.merge 基于一个或多个键连接 DataFrame 中的行。...注意 当您在列上进行列连接时,传递的 DataFrame 对象的索引会被丢弃。如果需要保留索引值,可以使用reset_index将索引附加到列中。 合并操作中要考虑的最后一个问题是处理重叠列名的方式。...特别是,您有许多额外的考虑: 如果对象在其他轴上的索引不同,我们应该合并这些轴中的不同元素还是仅使用共同的值? 连接的数据块在结果对象中需要被识别吗? “连接轴”中包含需要保留的数据吗?...它们可以以两种方式使用: 不带参数调用返回当前参数值(例如,ax.xlim()返回当前 x 轴绘图范围) 带参数调用设置参数值(例如,ax.xlim([0, 10])将 x 轴范围设置为 0 到...DataFrame 有许多选项,允许对列的处理方式进行一定的灵活性,例如,是否将它们全部绘制在同一个子图上,还是创建单独的子图。更多信息请参见 表 9.4。
可以支持从各种格式的文件中导入数据,比如CSV、EXCEL、JSON、SQL等,并提供了两种数据结构Series和DataFrame,可以方便的对数据进行操作运算清洗加工等。...Python环境搭建-从安装到Hello World 安装 ---- 如果使用pip安装: pip install pandas 如果使用conda安装: conda install pandas 如果使用的是...DataFrame DataFrame表示二维数据,即二维数组,或表格。是由若干列Series组成的,每列的数据类型可以不同。...使用函数pandas.DataFrame(data, index, columns, dtype, copy)创建,data和index参数同Series,columns是列名,其实对应Series中的...axis默认0表示以行为连接轴,为1表示以列为连接轴;level指定多层索引的组;dropna默认True删除含NA的行和列,为False则不删NA的行列。
在 SQL 中经常会使用JOIN操作来组合两个或多个表。有很多种不同种类的 JOINS操作,并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。...SQL语句提供了很多种JOINS 的类型: 内连接 外连接 全连接 自连接 交叉连接 在本文将重点介绍自连接和交叉连接以及如何在 Pandas DataFrame 中进行操作。...自连接 顾名思义,自连接是将 DataFrame 连接到自己的连接。也就是说连接的左边和右边都是同一个DataFrame 。自连接通常用于查询分层数据集或比较同一 DataFrame 中的行。...这个示例数据种两个 DataFrame 都没有索引所以使用 pandas.merge() 函数很方便。...总结 在本文中,介绍了如何在Pandas中使用连接的操作,以及它们是如何在 Pandas DataFrame 中执行的。这是一篇非常简单的入门文章,希望在你处理数据的时候有所帮助。
我已经将本文的源码和测试数据放到Github上: pandas_tutorial ,读者可以前往获取。 另外,pandas常常和NumPy一起使用,本文中的源码中也会用到NumPy。...这两种类型的数据结构对比如下: ? DataFrame可以看做是Series的容器,即:一个DataFrame中可以包含若干个Series。...这段输出说明如下: 输出的最后一行是Series中数据的类型,这里的数据都是int64类型的。 数据在第二列输出,第一列是数据的索引,在pandas中称之为Index。...请注意: DataFrame的不同列可以是不同的数据类型 如果以Series数组来创建DataFrame,每个Series将成为一行,而不是一列 例如: ? df4的输出如下: ?...我们可以通过下面的形式给DataFrame添加或者删除列数据: ? 这段代码输出如下: ? Index对象与数据访问 pandas的Index对象包含了描述轴的元数据信息。
领取专属 10元无门槛券
手把手带您无忧上云