首页
学习
活动
专区
圈层
工具
发布

Python中的DataFrame模块学

本文是基于Windows系统环境,学习和测试DataFrame模块:   Windows 10   PyCharm 2018.3.5 for Windows (exe)   python 3.6.8...()   data['ID'] = range(0,10)   print(np.shape(data)) # (10,1)   DataFrame增加一列数据,且值相同   import pandas...重新调整index的值   import pandas as pd   data = pd.DataFrame()   data['ID'] = range(0,3)   # data =   # ID...'表示去除行 1 or 'columns'表示去除列   # how: 'any'表示行或列只要含有NaN就去除,'all'表示行或列全都含有NaN才去除   # thresh: 整数n,表示每行或列中至少有...n个元素补位NaN,否则去除   # subset: ['name', 'gender'] 在子集中去除NaN值,子集也可以index,但是要配合axis=1   # inplace: 如何为True,

3.5K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    (六)Python:Pandas中的DataFrame

    目录 基本特征 创建 自动生成行索引 自定义生成行索引 使用 索引与值 基本操作 统计功能  ---- 基本特征 一个表格型的数据结构 含有一组有序的列(类似于index) 大致可看成共享同一个index...                我们可以通过一些基本方法来查看DataFrame的行索引、列索引和值,代码如下所示: import pandas as pd import numpy as np data...,但这种方式是直接对原始数据操作,不是很安全,pandas 中可利用 drop()方法删除指定轴上的数据,drop()方法返回一个新的对象,不会直接修改原始数据。...对象的修改和删除还有很多方法,在此不一一列举,有兴趣的同学可以自己去找一下 统计功能  DataFrame对象成员找最低工资和高工资人群信息          DataFrame有非常强大的统计功能,它有大量的函数可以使用...[frame.pay >='5000']) # 找出工资>=5000人员的信息 运行结果如下所示: 工资最低值 4000 工资>=5000人员的信息        name   pay

    7K20

    Python之Pandas中Series、DataFrame实践

    Python之Pandas中Series、DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签...1.2 Series的字符串表现形式为:索引在左边,值在右边。...2. pandas的数据结构DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值的)。...操作Series和DataFrame中的数据的基本手段 5.1 重新索引 reindex 5.2 丢弃指定轴上的项 drop 5.3 索引、选取和过滤(.ix) 5.4 算数运算和数据对齐 DataFrame...9.2 NA处理办法 dropna 根据各标签值中是否存在缺失数据对轴标签进行过滤,可通过阀值调节对缺失值的容忍度 fillna 用指定的或插值方法(如ffil或bfill

    5.5K50

    Python 数据处理 合并二维数组和 DataFrame 中特定列的值

    在本段代码中,numpy 用于生成随机数数组和执行数组操作,pandas 用于创建和操作 DataFrame。...在这个 DataFrame 中,“label” 作为列名,列表中的元素作为数据填充到这一列中。...print(random_array) print(values_array) 上面两行代码分别打印出前面生成的随机数数组和从 DataFrame 提取出来的值组成的数组。...结果是一个新的 NumPy 数组 arr,它将原始 DataFrame 中 “label” 列的值作为最后一列附加到了随机数数组之后。...运行结果如下: 总结来说,这段代码通过合并随机数数组和 DataFrame 中特定列的值,展示了如何在 Python 中使用 numpy 和 pandas 进行基本的数据处理和数组操作。

    7.7K00

    业界使用最多的Python中Dataframe的重塑变形

    pivot pivot函数用于从给定的表中创建出新的派生表 pivot有三个参数: 索引 列 值 def pivot_simple(index, columns, values): """...===== color black blue red item Item1 None 2 1 Item2 4 None 3 将上述数据中的...=============== ValueError: Index contains duplicate entries, cannot reshape 可以看到,现在index和columns对应的位置有不同的值...因此,必须确保我们指定的列和行没有重复的数据,才可以用pivot函数 pivot_table方法实现了类似pivot方法的功能 它可以在指定的列和行有重复的情况下使用 我们可以使用均值、中值或其他的聚合函数来计算重复条目中的单个值...假设我们有一个在行列上有多个索引的DataFrame。

    2.9K10

    Python - 字典中的值求和

    Python 提供了各种预定义的数据结构,包括列表、元组、映射、集合、堆和阵容。这些组件在每种编程语言中都至关重要。在这篇文章中,我们将专注于用于保存关键信息对的词典。...地图是Python中的一个关键数据组件,它使人们能够存储密钥和数据对。这些可与各种编程框架中的关联数组相媲美。这些旨在快速保存和访问数据。在参考书中,元素应该是不同的。相反,元素可以属于任何数据类别。...定义 在 Python 编程语言中,映射表示用于存储键及其各自值的无序容器。哈希映射中的元素可以存储任何数据类别,并且可以通过指向其相应的标识符来获取。...步骤2:可以访问与提供的键关联的字典值列表。 第 3 步:要计算值的总和,请使用 sum() 函数。 步骤 4:将总和分配给在步骤 1 中创建的变量。 步骤5:应打印或返回值的总和。...此方法在用于格式化的字符串上调用,以将存储在“total”中的值交换到指定的空间。这会导致预期的输出格式。结果表示“工资”数据集中的总体总收入。

    3.5K20

    python dataframe筛选列表的值转为list【常用】

    筛选列表中,当b列中为’1’时,所有c的值,然后转为list 2 .筛选列表中,当a列中为'one',b列为'1'时,所有c的值,然后转为list 3 .将a列整列的值,转为list(两种) 4....筛选列表,当a=‘one’时,取整行所有值,然后转为list 具体看下面代码: import pandas as pd from pandas import DataFrame df = DataFrame...当b列中为’1’时,所有c的值,然后转为list b_c = df.c[df['b'] == '1'].tolist() print(b_c) # out: ['一', '一', '四'] # 筛选列表中...,当a列中为'one',b列为'1'时,所有c的值,然后转为list a_b_c = df.c[(df['a'] == 'one') & (df['b'] == '1')].tolist() print...(a_b_c) # out: ['一', '一'] # 将a列整列的值,转为list(两种) a_list_1 = df.a.tolist() a_list_2 = df['a'].tolist(

    5.9K10

    在Excel中,如何根据值求出其在表中的坐标

    在使用excel的过程中,我们知道,根据一个坐标我们很容易直接找到当前坐标的值,但是如果知道一个坐标里的值,反过来求该点的坐标的话,据我所知,excel没有提供现成的函数供使用,所以需要自己用VBA编写函数使用...(代码来自互联网) 在Excel中,ALT+F11打开VBA编辑环境,在左边的“工程”处添加一个模块 把下列代码复制进去,然后关闭编辑器 Public Function iSeek(iRng As Range...False, False): Exit For Next If iAdd = "" Then iSeek = "#无" Else iSeek = iAdd End Function 然后即可在excel的表格编辑器中使用函数...iSeek了,从以上的代码可以看出,iSeek函数带三个参数,其中第一个和第二个参数制定搜索的范围,第三个参数指定搜索的内容,例如 iSeek(A1:P200,20),即可在A1与P200围成的二维数据表中搜索值

    15.5K20

    在Python-dataframe中如何把出生日期转化为年龄?

    作者:博观厚积 简书专栏:https://www.jianshu.com/u/2f376f777ef1 我们在做数据挖掘项目或大数据竞赛时,如果个体是人的时候,获得的数据中可能有出生日期的Series..., DataFrame import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline data = {'birth':...['10/8/00', '7/21/93', '6/14/01', '5/18/99', '1/5/98']} frame = DataFrame(data) frame ?...实际上我们在分析时并不需要人的出生日期,而是需要年龄,不同的年龄阶段会有不同的状态,比如收入、健康、居住条件等等,且能够很好地把不同样本的差异性进行大范围的划分,而不是像出生日期那样包含信息量过大且在算法训练时不好作为有效数据进行训练...在这里使用了dt.datetime.today().year来获取当前日期的年份,然后将birth数据中的年份数据提取出来(frame.birth.dt.year),两者相减就得到需要的年龄数据,如下

    2.6K20

    python下的Pandas中DataFrame基本操作(二),DataFrame、dict、array构造简析

    DataFrame简介:   DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。...其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。...导入基本python库: import numpy as np import pandas as pd DataFrame构造:   1:直接传入一个由等长列表或NumPy数组组成的字典; dict...参考资料:《利用Python进行数据分析》 在一个空的dataframe中插入数据 def test(): LIST=[1,2,3,4] empty = pd.DataFrame(columns

    6.3K30
    领券