首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

(六)Python:Pandas中的DataFrame

目录 基本特征 创建 自动生成行索引 自定义生成行索引 使用 索引与值 基本操作 统计功能  ---- 基本特征 一个表格型的数据结构 含有一组有序的列(类似于index) 大致可看成共享同一个index...的Series集合 创建         DataFrame与Series相比,除了可以每一个键对应许多值之外,还增加了列索引(columns)这一内容,具体内容如下所示: 自动生成行索引         ...(loc)和位置(iloc)索引,也可通过 append()方法或 concat()函数等进行处理,以 loc 为例,例如要给 aDF 添加一个新行,可用如下方法: import pandas as pd...,但这种方式是直接对原始数据操作,不是很安全,pandas 中可利用 drop()方法删除指定轴上的数据,drop()方法返回一个新的对象,不会直接修改原始数据。...对象的修改和删除还有很多方法,在此不一一列举,有兴趣的同学可以自己去找一下 统计功能  DataFrame对象成员找最低工资和高工资人群信息          DataFrame有非常强大的统计功能,它有大量的函数可以使用

3.8K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【数据处理包Pandas】DataFrame的创建

    index:行索引,用于指定行的标签,默认为整数索引。 columns:列索引,用于指定列的标签,默认为整数索引。 dtype:数据类型,用于指定DataFrame中的数据类型,默认为None。...NumPy 库和 Pandas 库: import numpy as np import pandas as pd 二、基于一维数据创建 DataFrame对象看成一维对象的有序序列,序列中的对象元素又分成按列排列和按行排列两种情况...(二)按行排列 按行排列,需要基于列表构建:列表中的元素可以是一维 Series 对象、一维列表、一维 Numpy 数组或字典都行。...','s02'],columns=['数学','英语','语文']) 3、基于字典创建 #***case3-③:基于字典创建,列名看作字典的键 pd.DataFrame({'数学':[97,95],'英语...字符串在 Pandas 中被处理成object类型的对象。

    6600

    Pandas创建DataFrame对象的几种常用方法

    DataFrame是pandas常用的数据类型之一,表示带标签的可变二维表格。本文介绍如何创建DataFrame对象,后面会陆续介绍DataFrame对象的用法。...pandas as pd 接下来就可以通过多种不同的方式来创建DataFrame对象了,为了避免排版混乱影响阅读,直接在我制作的PPT上进行截图。...生成后面创建DataFrame对象时用到的日期时间索引: ? 创建DataFrame对象,索引为2013年每个月的最后一天,列名分别是A、B、C、D,数据为12行4列随机数。 ?...根据字典来创建DataFrame对象,字典的“键”作为DataFrame对象的列名,其中B列数据是使用pandas的date_range()函数生成的日期时间,C列数据来自于使用pandas的Series...除此之外,还可以使用pandas的read_excel()和read_csv()函数从Excel文件和CSV文件中读取数据并创建DateFrame对象,后面会单独进行介绍。

    3.6K80

    pandas | DataFrame中的排序与汇总方法

    今天是pandas数据处理专题的第六篇文章,我们来聊聊DataFrame的排序与汇总运算。...排序 排序是我们一个非常基本的需求,在pandas当中将这个需求进一步细分,细分成了根据索引排序以及根据值排序。我们先来看看Series当中的排序方法。...Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。...这两个方法都会返回一个新的Series: ? 索引排序 对于DataFrame来说也是一样,同样有根据值排序以及根据索引排序这两个功能。...排名 有的时候我们希望得到元素的排名,我们会希望知道当前元素在整体当中排第几,pandas当中也提供了这个功能,它就是rank方法。 ?

    4.7K50

    pandas | DataFrame中的排序与汇总方法

    大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说pandas | DataFrame中的排序与汇总方法,希望能够帮助大家进步!!!...排序 排序是我们一个非常基本的需求,在pandas当中将这个需求进一步细分,细分成了根据索引排序以及根据值排序。我们先来看看Series当中的排序方法。...Series当中的排序方法有两个,一个是sort_index,顾名思义根据Series中的索引对这些值进行排序。另一个是sort_values,根据Series中的值来排序。...这两个方法都会返回一个新的Series: 索引排序 对于DataFrame来说也是一样,同样有根据值排序以及根据索引排序这两个功能。...排名 有的时候我们希望得到元素的排名,我们会希望知道当前元素在整体当中排第几,pandas当中也提供了这个功能,它就是rank方法。

    3.9K20

    Pandas DataFrame 中的自连接和交叉连接

    在 SQL 中经常会使用JOIN操作来组合两个或多个表。有很多种不同种类的 JOINS操作,并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。...要获取员工向谁汇报的姓名,可以使用自连接查询表。 我们首先将创建一个新的名为 df_managers的 DataFrame,然后join自己。...在join时需要删除了第二个df_managers的 manager_id,这样才不会报错。要获取经理的信息所以使用 how = 'left'。...下表说明了将表 df1 连接到另一个表 df2 时交叉连接的结果。 示例 2:创建产品的库存 此示例的目标是获取服装店的库存,可以通过任意的SKU(这里是颜色)获得组合。...总结 在本文中,介绍了如何在Pandas中使用连接的操作,以及它们是如何在 Pandas DataFrame 中执行的。这是一篇非常简单的入门文章,希望在你处理数据的时候有所帮助。

    4.3K20

    pandas | 详解DataFrame中的apply与applymap方法

    今天这篇文章我们来聊聊dataframe中的广播机制,以及apply函数的使用方法。 dataframe广播 广播机制我们其实并不陌生, 我们在之前介绍numpy的专题文章当中曾经介绍过广播。...在上面这个例子当中我们创建了一个numpy的数组,然后减去了它的第一行。我们对比下最后的结果会发现,arr数组当中的每一行都减去了它的第一行。 同样的操作在dataframe也一样可以进行。 ?...比如我们可以这样对DataFrame当中的某一行以及某一列应用平方这个方法。 ? 另外,apply中函数的作用域并不只局限在元素,我们也可以写出作用在一行或者是一列上的函数。...之所以我们叫它applymap而不是map,是因为在Series的方法当中,已经有了map,所以为了区分创建了applymap。...总结 今天的文章我们主要介绍了pandas当中apply与applymap的使用方法, 这两个方法在我们日常操作DataFrame的数据非常常用,可以说是手术刀级的api。

    3K20

    数据分析EPHS(2)-SparkSQL中的DataFrame创建

    本篇是该系列的第二篇,我们来讲一讲SparkSQL中DataFrame创建的相关知识。 说到DataFrame,你一定会联想到Python Pandas中的DataFrame,你别说,还真有点相似。...这个在后面的文章中咱们在慢慢体会,本文咱们先来学习一下如何创建一个DataFrame对象。...通体来说有三种方法,分别是使用toDF方法,使用createDataFrame方法和通过读文件的直接创建DataFrame。...由于比较繁琐,所以感觉实际工作中基本没有用到过,大家了解一下就好。 3、通过文件直接创建DataFrame对象 我们介绍几种常见的通过文件创建DataFrame。...4、总结 今天咱们总结了一下创建Spark的DataFrame的几种方式,在实际的工作中,大概最为常用的就是从Hive中读取数据,其次就可能是把RDD通过toDF的方法转换为DataFrame。

    1.6K20

    python下的Pandas中DataFrame基本操作,基本函数整理

    参考链接: Pandas DataFrame中的转换函数 pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中对pandas的方方面面都有了一个权威简明的入门级的介绍...,但在实际使用过程中,我发现书中的内容还只是冰山一角。...谈到pandas数据的行更新、表合并等操作,一般用到的方法有concat、join、merge。但这三种方法对于很多新手来说,都不太好分清使用的场合与用途。   ...DataFrame.iat快速整型常量访问器DataFrame.loc标签定位DataFrame.iloc整型定位DataFrame.insert(loc, column, value[, …])在特殊地点插入行...])Returns a cross-section (row(s) or column(s)) from the Series/DataFrame.DataFrame.isin(values)是否包含数据框中的元素

    2.5K00

    python下的Pandas中DataFrame基本操作(一),基本函数整理

    pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中对pandas的方方面面都有了一个权威简明的入门级的介绍,但在实际使用过程中,我发现书中的内容还只是冰山一角...谈到pandas数据的行更新、表合并等操作,一般用到的方法有concat、join、merge。但这三种方法对于很多新手来说,都不太好分清使用的场合与用途。...…]) 在特殊地点插入行 DataFrame.iter() Iterate over infor axis DataFrame.iteritems() 返回列名和序列的迭代器 DataFrame.iterrows...DataFrame.isin(values) 是否包含数据框中的元素 DataFrame.where(cond[, other, inplace, …]) 条件筛选 DataFrame.mask(cond...DataFrame.mad([axis, skipna, level]) 返回偏差 DataFrame.max([axis, skipna, level, …]) 返回最大值 DataFrame.mean

    11.1K80

    在 Python 中,通过列表字典创建 DataFrame 时,若字典的 key 的顺序不一样以及部分字典缺失某些键,pandas 将如何处理?

    pandas 官方文档地址:https://pandas.pydata.org/ 在 Python 中,使用 pandas 库通过列表字典(即列表里的每个元素是一个字典)创建 DataFrame 时,如果每个字典的...列顺序:在创建 DataFrame 时,pandas 会检查所有字典中出现的键,并根据这些键首次出现的顺序来确定列的顺序。...效率考虑:虽然 pandas 在处理这种不一致性时非常灵活,但是从效率角度考虑,在创建大型 DataFrame 之前统一键的顺序可能会更加高效。...dtype 参数指定了新 DataFrame 中的数据类型,这里设置为 np.float64,即双精度浮点数。 df:这行代码输出 DataFrame,以便查看其内容。...总而言之,pandas 在处理通过列表字典创建 DataFrame 时各个字典键顺序不同以及部分字典缺失某些键时显示出了极高的灵活性和容错能力。

    13500
    领券