首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

PythonDataFrame模块学

本文是基于Windows系统环境,学习和测试DataFrame模块:   Windows 10   PyCharm 2018.3.5 for Windows (exe)   python 3.6.8...初始化DataFrame   创建一个空DataFrame变量   import pandas as pd   import numpy as np   data = pd.DataFrame()   ...('user.csv')   print (data)   将DataFrame数据写入csv文件   to_csv()函数参数配置参考官网pandas.DataFrame.to_csv   import...异常处理   过滤所有包含NaN行   dropna()函数参数配置参考官网pandas.DataFrame.dropna   from numpy import nan as NaN   import...'表示去除行 1 or 'columns'表示去除列   # how: 'any'表示行或列只要含有NaN就去除,'all'表示行或列全都含有NaN才去除   # thresh: 整数n,表示每行或列至少有

2.4K10

(六)Python:PandasDataFrame

DataFrame也能自动生成行索引,索引从0开始,代码如下所示: import pandas as pd data = {'name': ['aaaaaa', 'bbbbbb', 'cccccc']...行索引、列索引和值,代码如下所示: import pandas as pd import numpy as np data = np.array([('aaaa', 4000), ('bbbb',...对象列和行可获得Series          具体实现如下代码所示: import pandas as pd import numpy as np data = np.array([('xiaoming...,但这种方式是直接对原始数据操作,不是很安全,pandas 可利用 drop()方法删除指定轴上数据,drop()方法返回一个新对象,不会直接修改原始数据。...对象修改和删除还有很多方法,在此不一一列举,有兴趣同学可以自己去找一下 统计功能  DataFrame对象成员找最低工资和高工资人群信息          DataFrame有非常强大统计功能,它有大量函数可以使用

3.8K20
您找到你想要的搜索结果了吗?
是的
没有找到

Python之PandasSeries、DataFrame实践

Python之PandasSeries、DataFrame实践 1. pandas数据结构Series 1.1 Series是一种类似于一维数组对象,它由一组数据(各种NumPy数据类型)以及一组与之相关数据标签...dataframe数据是以一个或者多个二位块存放(而不是列表、字典或者别的一维数据结构)。 3.索引对象 pandas索引对象负责管理轴标签和其他元素(比如轴名称等)。...4. pandas主要Index对象 Index 最泛化Index对象,将轴标签表示为一个由Python对象组成NumPy数组 Int64Index 针对整数特殊Index MultiIndex...操作Series和DataFrame数据基本手段 5.1 重新索引 reindex 5.2 丢弃指定轴上项 drop 5.3 索引、选取和过滤(.ix) 5.4 算数运算和数据对齐 DataFrame...处理缺失数据(Missing data) 9.1 pandas使用浮点值NaN(Not a Number)表示浮点和非浮点数组缺失数据。

3.9K50

业界使用最多PythonDataframe重塑变形

pivot pivot函数用于从给定创建出新派生表 pivot有三个参数: 索引 列 值 def pivot_simple(index, columns, values): """...===== color black blue red item Item1 None 2 1 Item2 4 None 3 将上述数据...因此,必须确保我们指定列和行没有重复数据,才可以用pivot函数 pivot_table方法实现了类似pivot方法功能 它可以在指定列和行有重复情况下使用 我们可以使用均值、中值或其他聚合函数来计算重复条目中单个值...], aggfunc={"mt_income":[np.sum],"impression":[np.sum]}) stack/unstack 事实上,变换一个表只是堆叠DataFrame一种特殊情况...假设我们有一个在行列上有多个索引DataFrame

1.9K10

pythonPandasDataFrame基本操作(二),DataFrame、dict、array构造简析

DataFrame简介:   DataFrame是一个表格型数据结构,它含有一组有序列,每列可以是不同值类型(数值、字符串、布尔值等)。...跟其他类似的数据结构相比(如Rdata.frame),DataFrame面向行和面向列操作基本上是平衡。...其实,DataFrame数据是以一个或多个二维块存放(而不是列表、字典或别的一维数据结构)。...导入基本python库: import numpy as np import pandas as pd DataFrame构造:   1:直接传入一个由等长列表或NumPy数组组成字典; dict...参考资料:《利用Python进行数据分析》 在一个空dataframe插入数据 def test(): LIST=[1,2,3,4] empty = pd.DataFrame(columns

4.3K30

python类迭代器实现,代码优化好东西

---- 本节知识视频教程 以下开始文字讲解: 一、迭代器 我们其实可以把迭代器看做集合,集合类似列表,但是迭代器所消耗内存资源要小于集合。...迭代解释一下意思就是:循环 迭代器在python中去实现,我们代码表现为__iter__方法,而__iter__方法必须返回一个迭代器。...迭代器实现后,每一次迭代返回结果在__next__方法。 二、迭代器案例 下面我们通过一个实例来使用迭代器,视频教程我们举例利用迭代器实现输出一个三角形步骤思路: 1.写一个自定义类。...2.在类实现一个__iter__方法,构造出迭代器。 3.再实现一个__next__方法,返回奇数个星号,获取迭代结果。 4.对于需要一些变量,我们再次在__init__方法进行初始化。...5.实例化类对象。 6.利用for循环输出自定义迭代类。 三、总结强调 1.掌握迭代器概念与意义。 2.掌握类来实现自定义迭代器。 3.掌握利用迭代器实现一个直角三角形。

1K10

Python 代码优化实践

最近在用 Python 写一个一键替换文件脚本文件,大概功能是,向程序传递一个本地或 SFTP 目录参数,程序可以把指定目录所有文件替换到特定应用程序对应目录。...从目前代码能发现至少有 2 个地方可以优化: 函数之间需要传递参数太多了,可以看看是否全部必要,考虑下如何精简; 部分业务逻辑太细化,有重复代码实现,导致实现看起来比较臃肿。...对于第 1 点,优化思路是:对于非所有函数都必须调用参数,尽可能固化到实际使用函数,避免各函数仅仅做了传递员工作。...对于第 2 点,优化思路是:合并同类项,对于重复代码部分,尽可能提取到共用逻辑实现。...下面是优化代码: #执行本地文件替换具体操作 def ReplaceLocalFiles(filepath, bydir): if (":" not in filepath) or (not

42940

Python代码性能优化

Python性能优化一般步骤: 步骤1:找到性能 瓶颈 步骤2:优化性能 瓶颈 步骤3:goto 『步骤1』 找出瓶颈 不要相信直觉,使用专业工具 使用专业工具:...,range实现方式是直接在内存开辟一个静态数组,而xrange则是通过迭代方式动态去生成,所以显而易见,在需要数据量特别大时候,range则会非常耗费内存,所以其优化方式如下: def...,在python3,已经用xrange来代替range了,所以在python3里面,不存在这种性能问题。...循环或while循环迭代方式拥有更好性能,所以可以用列表迭代式进行代替,但是这样会大大降低代码可读性,所以在性能和代码可读性方面要认真权衡。...,这是第一点,第二点是在判断一个数是否在一个列表时,采用迭代方式来判断,其时间复杂度是O(n),而当采用set时,由于set实现方式是基于哈希方式进行存取,故在找一个元素是否在一个列表里时候

43120

pythonPandasDataFrame基本操作(一),基本函数整理

pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】对pandas方方面面都有了一个权威简明入门级介绍,但在实际使用过程,我发现书中内容还只是冰山一角...谈到pandas数据行更新、表合并等操作,一般用到方法有concat、join、merge。但这三种方法对于很多新手来说,都不太好分清使用场合与用途。...DataFrame.ndim 返回数据框纬度 DataFrame.size 返回数据框元素个数 DataFrame.shape 返回数据框形状 DataFrame.memory_usage([index...() 以布尔方式返回空值 DataFrame.notnull() 以布尔方式返回非空值 索引和迭代 方法 描述 DataFrame.head([n]) 返回前n行数据 DataFrame.at 快速标签常量访问器...DataFrame.isin(values) 是否包含数据框元素 DataFrame.where(cond[, other, inplace, …]) 条件筛选 DataFrame.mask(cond

11K80
领券