首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最全面的Pandas的教程!没有之一!

获取 DataFrame 中的一行或多行数据 要获取某一行,你需要用 .loc[] 来按索引(标签名)引用这一行,或者用 .iloc[],按这行在表中的位置(行数)来引用。 ?...比如,提取 'c' 行中 'Name’ 列的内容,可以如下操作: ? 此外,你还可以制定多行和/或多列,如上所示。...当你使用 .dropna() 方法时,就是告诉 Pandas 删除掉存在一个或多个空值的行(或者列)。删除列用的是 .dropna(axis=0) ,删除行用的是 .dropna(axis=1) 。...因此,当你使用 pd.concat() 的时候,一定要注意堆叠方向的坐标轴(行或列)含有所需的所有数据。...Pandas 的数据透视表能自动帮你对数据进行分组、切片、筛选、排序、计数、求和或取平均值,并将结果直观地显示出来。比如,这里有个关于动物的统计表: ?

26K64
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    一文讲述Pandas库的数据读取、数据获取、数据拼接、数据写出!

    header=None,主要针对没有标题行的excel文件,系统不会将第一行数据作为标题,而是默认取一个1,2,3…这样的标题。 header=正整数值,指定哪一行作为标题行。...这里我一共提供了5种需要掌握的数据获取方式,分别是 “访问一列或多列” ,“访问一行或多行” ,“访问单元格中某个值” ,“访问多行多列” 。...”的方式,就可以获取到一列或多列。...方法1:访问一列 df["武汉"] 方法2:访问多列 df[["武汉","广水"]] ③ 访问一行或多行 “访问一行或多行”,方法就比较多了,因此特别容易出错,因此需要特别注意。...# 使用位置索引 df.iloc[2,1] # 使用标签索引 df.loc["地区3","天门"] ⑤ 访问多行多列 “访问多行多列”,方法就更多了。我一共为大家总结了5种方法。

    8.2K30

    懂Excel就能轻松入门Python数据分析包pandas(十二):多列堆叠

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 Excel 是奇葩不规范数据的重灾区,这主要是因为他有高度的灵活性,今天来看看一个多列堆叠问题。...现在来看看,在 pandas 中怎么简单转换成规范的2列数据: - 第一句主要是为了最后结果的标题与原数据标题一致而已 - 关键是第二句,这里直接使用 numpy 的 reshape 方法,即可完成需求...也就是一行行扫过,转换成2列。...但你可能希望转换过程是竖向完成,这时我们可以这样子做: - 这次还是先横向转换,而第二句代码则是处理的关键 - [arr[i::3] for i in range(3)],我们需要从横向的结果每3行取出作为一个数组...用 pandas 不就是为了既可自动化处理,又可以少写点代码吗 总结 - numpy 的 reshape 方法,可以快速把数组转换成指定行数或列数 - 用 -1 可以让 numpy 自动计算行或列的数量

    72610

    懂Excel就能轻松入门Python数据分析包pandas(十二):多列堆叠

    后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas 前言 Excel 是奇葩不规范数据的重灾区,这主要是因为他有高度的灵活性,今天来看看一个多列堆叠问题。...现在来看看,在 pandas 中怎么简单转换成规范的2列数据: - 第一句主要是为了最后结果的标题与原数据标题一致而已 - 关键是第二句,这里直接使用 numpy 的 reshape 方法,即可完成需求...也就是一行行扫过,转换成2列。...但你可能希望转换过程是竖向完成,这时我们可以这样子做: - 这次还是先横向转换,而第二句代码则是处理的关键 - [arr[i::3] for i in range(3)],我们需要从横向的结果每3行取出作为一个数组...用 pandas 不就是为了既可自动化处理,又可以少写点代码吗 总结 - numpy 的 reshape 方法,可以快速把数组转换成指定行数或列数 - 用 -1 可以让 numpy 自动计算行或列的数量

    80720

    干货!直观地解释和可视化每个复杂的DataFrame操作

    诸如字符串或数字之类的非列表项不受影响,空列表是NaN值(您可以使用.dropna()清除它们 )。 ? 在DataFrame df中Explode列“ A ” 非常简单: ?...Stack 堆叠采用任意大小的DataFrame,并将列“堆叠”为现有索引的子索引。因此,所得的DataFrame仅具有一列和两级索引。 ? 堆叠名为df的表就像df.stack()一样简单 。...要记住:从外观上看,堆栈采用表的二维性并将列堆栈为多级索引。 Unstack 取消堆叠将获取多索引DataFrame并对其进行堆叠,将指定级别的索引转换为具有相应值的新DataFrame的列。...可以按照与堆叠相同的方式执行堆叠,但是要使用level参数: df.unstack(level = -1)。 Merge 合并两个DataFrame是在共享的“键”之间按列(水平)组合它们。...Concat 合并和连接是水平工作,串联或简称为concat,而DataFrame是按行(垂直)连接的。

    13.3K20

    用过Excel,就会获取pandas数据框架中的值、行和列

    我们仍使用以前的示例文件“用户.xlsx” 图1 图2 可以看到,对于这个小表格/数据框架: 共有5列,名称分别为:“用户姓名”、“国家”、“城市”、“性别”、“年龄” 共有4行(标题行除外) df.index...df.columns 提供列(标题)名称的列表。 df.shape 显示数据框架的维度,在本例中为4行5列。 图3 使用pandas获取列 有几种方法可以在pandas中获取列。...获取1行 图7 获取多行 我们必须使用索引/切片来获取多行。在pandas中,这类似于如何索引/切片Python列表。...要获取前三行,可以执行以下操作: 图8 使用pandas获取单元格值 要获取单个单元格值,我们需要使用行和列的交集。...想想如何在Excel中引用单元格,例如单元格“C10”或单元格区域“C10:E20”。以下两种方法都遵循这种行和列的思想。 方括号表示法 使用方括号表示法,语法如下:df[列名][行索引]。

    19.2K60

    数据导入与预处理-拓展-pandas可视化

    数据导入与预处理-拓展-pandas可视化 1. 折线图 1.1 导入数据 1.2 绘制单列折线图 1.3 绘制多列折线图 1.4 绘制折线图-双y轴 2....条形图 2.1 单行垂直/水平条形图 2.2 多行条形图 3. 直方图 3.1 生成数据 3.2 透明度/刻度/堆叠直方图 3.3 拆分子图 4....df 的四列分别放在一个图上 # 折线图|绘制 df 全部列的折线图 # 同时指定 画布大小 标题 显示网格线 x轴标签 y轴标签 轴字体大小 df.plot(figsize=(10, 6), #...df2 的第 3 行 df2.iloc[2].plot(kind = 'bar', figsize=(10, 6)) plt.show() 输出为: 2.2 多行条形图 多行堆叠 # 多行,堆叠对应着着...总结 关于pandas的可视化的用法还有很多,这里不再拓展,但还是建议使用matplotlib,seaborn等库完成绘图。

    3.1K20

    高效的5个pandas函数,你都用过吗?

    pandas还有很多让人舒适的用法,这次再为大家介绍5个pandas函数,作为这个系列的第二篇。 1. explode explode用于将一行数据展开成多行。...比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。...用法: DataFrame.explode(self, column: Union[str, Tuple]) 参数作用: column :str或tuple 以下表中第三行、第二列为例,展开[2,3,8...Nunique Nunique用于计算行或列上唯一值的数量,即去重后计数。这个函数在分类问题中非常实用,当不知道某字段中有多少类元素时,Nunique能快速生成结果。...首先创建一个df,共2列,1000000行。

    1.2K20

    高效的5个pandas函数,你都用过吗?

    pandas还有很多让人舒适的用法,这次再为大家介绍5个pandas函数,作为这个系列的第二篇。 1. explode explode用于将一行数据展开成多行。...比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。...用法: DataFrame.explode(self, column: Union[str, Tuple]) 参数作用: column :str或tuple 以下表中第三行、第二列为例,展开[2,3,8...Nunique Nunique用于计算行或列上唯一值的数量,即去重后计数。这个函数在分类问题中非常实用,当不知道某字段中有多少类元素时,Nunique能快速生成结果。...首先创建一个df,共2列,1000000行。

    1.2K40

    因Pandas版本较低,这个API实现不了咋办?

    所以,今天就以此为题展开拓展分析,再输出一点Pandas干货…… ? 问题描述:一个pandas dataframe数据结构存在一列是集合类型(即包含多个子元素),需要将每个子元素展开为一行。...这一场景运用pandas中的explodeAPI将会非常好用,简单高效。然而,由于线上部署pandas版本为0.23,而explode API是在0.25以后版本中引入,所以无法使用。...基于这一思路,可将问题拆解为两个子问题: 含有列表元素的单列分为多列 多列转成多行 而这两个子问题在pandas丰富的API中其实都是比较简单的,例如单列分为多列,那么其实就是可直接用pd.Series...至此,实际上是完成了单列向多列的转换,其中由于每列包含元素个数不同,展开后的长度也不尽一致,pandas会保留最长的长度,并将其余填充为空值(正因为空值的存在,所以原本的整数类型自动变更为小数类型)。...stack原义为堆栈的意思,放到pandas中就是将元素堆叠起来——从宽表向长表转换。

    1.9K30

    Pandas图鉴(三):DataFrames

    第二种情况,它对行和列都做了同样的事情。向Pandas提供列的名称而不是整数标签(使用列参数),有时提供行的名称。...在Pandas中,引用多行/列是一种复制,而不是一种视图。但它是一种特殊的复制,允许作为一个整体进行赋值: df.loc['a']=10工作(单行可作为一个整体写入)。...垂直stacking 这可能是将两个或多个DataFrame合并为一个的最简单的方法:你从第一个DataFrame中提取行,并将第二个DataFrame中的行附加到底部。...通过MultiIndex进行堆叠 如果行和列的标签都重合,concat可以做一个相当于垂直堆叠的MultiIndex(像NumPy的dstack): 如果行和/或列部分重叠,Pandas将相应地对齐名称...要将其转换为宽格式,请使用df.pivot: 这条命令抛弃了与操作无关的东西(即索引和价格列),并将所要求的三列信息转换为长格式,将客户名称放入结果的索引中,将产品名称放入其列中,将销售数量放入其 "

    44420

    手把手 | 如何用Python做自动化特征工程

    转换作用于单个表(从Python角度来看,表只是一个Pandas 数据框),它通过一个或多个现有的列创建新特征。 例如,如果我们有如下客户表。...在数据表的范畴中,父表的每一行代表一位不同的父母,但子表中的多行代表的多个孩子可以对应到父表中的同一位父母。...例如,在我们的数据集中,clients客户数据框是loan 贷款数据框的父级,因为每个客户在客户表中只有一行,但贷款可能有多行。...转换:在单个表上对一列或多列执行的操作。一个例子是在一个表中取两个列之间的差异或取一列的绝对值。 在featuretools中使用这些基元本身或堆叠多个基元,来创建新功能。...聚合就是将深度特征合成依次将特征基元堆叠 ,利用了跨表之间的一对多关系,而转换是应用于单个表中的一个或多个列的函数,从多个表构建新特征。

    4.3K10

    Pandas 学习手册中文第二版:11~15

    ,并将它们旋转到新DataFrame上的列中,同时为原始DataFrame的适当行和列中的新列填充了值。...堆叠 与枢轴函数相似的是.stack()和.unstack()方法。 堆叠过程将列标签的级别旋转到行索引。 取消堆叠执行相反的操作,即将行索引的某个级别旋转到列索引中。...首先,堆叠和解除堆叠总是将级别移动到另一个索引的最后级别。 请注意,who级别现在是行索引的最后一个级别,但它较早开始作为第一个级别。...从技术上讲,熔化是将DataFrame对象整形为 格式的过程,其中通过不旋转variable列中的列标签来创建两个或更多列,分别称为variable和value ,然后将数据从这些列移到value列中的适当位置...然后将所有其他列制作为有助于描述数据的标识符列。 通常使用一个简单的例子可以最好地理解熔化的概念。

    3.4K20

    Pandas图鉴(四):MultiIndex

    MultiIndex 剖析 MultiIndex 对于没有听说过Pandas的人来说,MultiIndex最直接的用法是使用第二个索引列作为第一个索引列的补充,可以更加独特地识别每一行。...你可以同时选择行和列。 你可以学习如何使用slice来代替冒号。...作为一维的,Series在不同情况下可以作为行向量或列向量,但通常被认为是列向量(例如DataFrame的列)。 比如说: 也可以通过名称或位置索引来指定要堆叠/取消堆叠的级别。...将MultiIndex转换为flat的索引并将其恢复 方便的查询方法只解决了处理行中MultiIndex的复杂性。...一种方法是将所有不相关的列索引层层叠加到行索引中,进行必要的计算,然后再将它们解叠回来(使用pdi.lock来保持原来的列顺序)。

    62120

    干货:用Python加载数据的5种不同方式,收藏!

    现在,在手动检查了csv之后,我知道列名在第一行中,因此在我的第一次迭代中,我必须将第一行的数据存储在 col中, 并将其余行存储在 data中。...为了更漂亮地读取数据,我将其作为数据框格式返回,因为与numpy数组或python的列表相比,读取数据框更容易。 输出量 ? ?...由于数据量很大,我们仅打印了前5行。 利弊 使用此功能的一个重要方面是您可以将文件中的数据快速加载到numpy数组中。 缺点是您不能有其他数据类型或数据中缺少行。 3....比第一个要好得多,但是这里的“列”标题是“行”,要使其成为列标题,我们必须添加另一个参数,即 名称 ,并将其设置为 True, 这样它将第一行作为“列标题”。...这将创建一个新文件 test.pkl ,其中包含来自 Pandas 标题的 pdDf 。 现在使用pickle打开它,我们只需要使用 pickle.load 函数。 ? ?

    2.8K10

    列表,表格与媒体元素

    3)定义列表      定义列表是一种很特殊的列表形式,它是标题及列表项的结合.定义列表的语法相对于有序和无序列表不太一样,它使用标签作为列表的开始,使用标签作为每个列表项的起始,而对于每个列表项的定义则使用...1)没有顺序,每个标签,标签独占一行(块元素)       2)默认没有标记       3)一般用于(一个标题下有一个或多个列表项)*n的情况   2.列表常用场合及列表使用中的注意事项...   >这种严格的约束形成了一个不易变形的长方形盒子结构,堆叠排列起来结构很稳定   2.表格的基本结构     1)单元格:    单元格是表格的最小单位,一个或多个单元格纵横排列组成了列     ...2)行:    一个或多个单元格横向堆叠形成了行     3)列:    由于表格单元格的高度必须一致,因此单元格纵向排列形成了列   3.表格的基本语法   语法:       第一行第一个...可以有多行       3)在第一行标签...里创建单元格标签...可以创建表格标题       4)在行标签...

    3K100
    领券