首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

pandas | 使用pandas进行数据处理——DataFrame

今天是pandas数据处理专题的第二篇文章,我们一起来聊聊pandas当中最重要的数据结构——DataFrame。...而DataFrame可以简单了理解成Series构成的dict,这样就将数据拼接成了二维的表格。并且为我们提供了许多表级别数据处理以及批量数据处理的接口,大大降低了数据处理的难度。...创建DataFrame DataFrame是一个表格型的数据结构,它拥有两个索引,分别是行索引以及列索引,使得我们可以很方便地获取对应的行以及列。这就大大降低了我们查找数据处理数据的难度。...虽然DataFrame可以近似看成是Series组合成的dict,但实际上它作为一个单独的数据结构,也拥有许多自己的api,支持许多花式的操作,是我们处理数据强有力的工具。...在Python领域当中,pandas是数据处理最好用的手术刀和工具箱,希望大家都能将它掌握。

3.4K10
您找到你想要的搜索结果了吗?
是的
没有找到

数据分析 ——— pandas日期处理(五)

通过之前的文章,大家对pandas都有了基础的了解,在接下来的文章中就是对pandas的一些补充,pandas日期处理函数。...一、pandas日期功能 1) 创建一个日期范围 通过指定周期和频率来使用date.range()函数,默认频率为/天 # pandas日期处理 import pandas as pd import...bdate_range()表示商业日期范围,与date_range()不同,它不包括周六和周天 # bdate_range() 商业日期范围,不包括周六和周天 print(pd.bdate_range...import pandas as pd import numpy as np start = pd.datetime(2019, 8,2) end = pd.datetime(2019, 8, 8)...timedelta 1)通过传递字符串,创建timedelta对象: import pandas as pd # 通过传递字符串文字,我们可以创建一个timedelta对象。

1.3K10

DataFrame的数据处理Pandas读书笔记6)

本期和大家分享DataFrame数据的处理~ 一、提取想要的列 第一种方法就是使用方法,略绕,使用.列名的方法可以提取对应的列! 第二张方法类似列表中提取元素!本方法是我们将来比较常用的方法。...所以DataFrame可以看做是Series的集合,而提取出任意的列就是Series。 二、提取想要的行 DataFrame有个特性就是可以任意进行行列处理,那如何提取某行呢?...三、DataFrame的赋值 当我们先创建的DataFrame列数大于原始数据的时候,就会以NaN方式显示,这个上期已经介绍过,当我们对某一列进行赋值的时候,整个列会赋值给一个相同的值。...如果我们直接对某个不存在的列进行赋值,pandas同样会默认帮我们创建好新的列,然后将对应的值存进去。...四、DataFrame的转置 对象.T方法可以将DataFrame进行转置,这里需要说明,该方法并不改变原数据的存储,如果想改变原数据需要重新赋值一次!

1.1K50

Pandas数据处理2、DataFrame的drop函数具体参数使用详情

Pandas数据处理2、DataFrame的drop函数具体参数使用详情 ---- 目录 Pandas数据处理2、DataFrame的drop函数具体参数使用详情 前言 环境 基础函数的使用 drop...处理,在最基础的OpenCV中也会有很多的Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个...版本:1.4.4 基础函数的使用 Pandas数据处理——渐进式学习1、Pandas入门基础 Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索) ---- drop...编码测试 这里先创建一个测试数据 import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗...import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗', '王语嫣', '赵飞燕',

1.3K30

Pandas数据处理3、DataFrame去重函数drop_duplicates()详解

Pandas数据处理3、DataFrame去重函数drop_duplicates()详解 ---- 目录 Pandas数据处理3、DataFrame去重函数drop_duplicates()详解 前言...处理,在最基础的OpenCV中也会有很多的Pandas处理,所以我OpenCV写到一般就开始写这个专栏了,因为我发现没有Pandas处理基本上想好好的操作图片数组真的是相当的麻烦,可以在很多AI大佬的文章中发现都有这个...版本:1.4.4 基础函数的使用 Pandas数据处理——渐进式学习1、Pandas入门基础 Pandas数据处理——渐进式学习、DataFrame(函数检索-请使用Ctrl+F搜索) ---- drop_duplicates...import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗', '王语嫣', '赵飞燕',...import pandas as pd import numpy as np df = pd.DataFrame( {'name': ['张丽华', '李诗诗', '王语嫣', '赵飞燕',

88930

python+pandas+时间、日期以及时间序列处理方法

python+pandas+时间、日期以及时间序列处理方法 先简单的了解下日期和时间数据类型及工具 python标准库包含于日期(date)和时间(time)数据的数据类型,datetime、time以及...datetime模块中的数据类型 类型 说明date 以公历形式存储日历日期(年、月、日)time 将时间存储为时、分、秒、毫秒datetime 存储日期和时间timedelta...通常用于处理成组日期,不管这些日期DataFrame的轴索引还是列,to_datetime方法可以解析多种不同的日期表示形式。...时间序列基础以及时间、日期处理 pandas最基本的时间序列类型就是以时间戳(时间点)(通常以python字符串或datetime对象表示)为索引的Series: dates = ['2017-06-20...2)日期和时间的主要python,datetime、timedelta、pandas.to_datetime等3)以时间为索引的Series和DataFrame的索引、切片4)带有重复时间索引时的索引,

1.6K10

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

本文我们讨论pandas的内存使用,展示怎样简单地为数据列选择合适的数据类型,就能够减少dataframe近90%的内存占用。...Dataframe对象的内部表示 在底层,pandas会按照数据类型将列分组形成数据块(blocks)。...如果不能在一开始就创建dataframe,我们怎样才能应用内存节省技术呢? 幸运的是,我们可以在读入数据集的时候指定列的最优数据类型pandas.read_csv()函数有一些参数可以做到这一点。...首先,我们将每一列的目标类型存储在以列名为键的字典中,开始前先删除日期列,因为它需要分开单独处理。 现在我们使用这个字典,同时传入一些处理日期的参数,让日期以正确的格式读入。...总结 我们学习了pandas如何存储不同的数据类型,并利用学到的知识将我们的pandas dataframe的内存用量降低了近90%,仅仅只用了一点简单的技巧: 将数值型列降级到更高效的类型 将字符串列转换为类别类型

8.6K50

pandas 变量类型转换的 6 种方法

另外,空值类型作为一种特殊类型,需要单独处理,这个在pandas缺失值处理一文中已详细介绍。 数据处理的过程中,经常需要将这些类型进行互相转换,下面介绍一些变量类型转换的常用方法。...1、查询变量类型 在数据处理的过程中,针对不同的数据类型会有不同的处理方法,比如数值型可以做加减乘除,但是字符型、时间类型就需要其它处理方法。...为此,我们首先需要将各种数据类型进行区分,然后再分别处理。...如果想要查看所有变量的数据类型,可以通过info快速查看,如下: df.info() >> RangeIndex: 6 entries...转换数据类型比较通用的方法可以用astype进行转换。 pandas中有种非常便利的方法to_numeric()可以将其它数据类型转换为数值类型。

4.2K20

Pandas入门2

image.png 5.4.3 DataFrame对象的applymap方法 需要1个参数,参数的数据类型为函数对象,applymap方法的返回值的数据类型DataFrame。...image.png 5.8 缺失值处理 缺失值数据在大部分数据分析应用中都很常见,pandas的设计目标之一就是让缺失数据的处理任务尽量轻松。 pandas对象上的所有描述统计都排除了缺失数据。...7.1 Python标准库 包含用于日期(date)和时间(time)数据的数据类型,而且还有日历方面的功能。主要使用datetime、 time、 calendar模块。...image.png 7.3 Pandas中的时间序列 pandas通常是用于处理成组日期的,不管这个日期DataFrame的轴索引还是列。to_datetime方法可以解析多种不同的日期表示形式。...对标准日期形式的解析非常快。 to_datetime方法可以处理缺失值,缺失值会被处理为NaT(not a time)。 ?

4.2K20

Pandas笔记

日期类型数据处理: # pandas识别的日期字符串格式 dates = pd.Series(['2011', '2011-02', '2011-03-01', '2011/04/01',...'2011/05/01 01:01:01', '01 Jun 2011', '20110701','2011/8/1']) # to_datetime() 转换日期数据类型...dtype: timedelta64[ns] timedelta64[ns] ... # 把时间偏移量换算成天数 print(delta.dt.days) # 在这只能timedelta64.dt.days 不能写其他的...DataFrame DataFrame是一个类似于表格(有行有列)的数据类型,可以理解为一个二维数组,索引有两个维度(行级索引,列级索引),可更改。...DataFrame具有以下特点: 列和列之间可以是不同的类型 :不同的列的数据类型可以不同 大小可变 (扩容) 标记轴(行级索引 和 列级索引) 针对行与列进行轴向统计(水平,垂直) import pandas

7.6K10

python DataFrame数据生成

index也有列索引columns,创建DataFrame的基本方法为df = pd.DataFrame(data, index=index,columns=columns),其中data参数的数据类型可以支持由列表...行索引index在此处表示为交易日期Pandas提供了强大的处理日期数据的功能,我们使用pandas.date_range()生成DatetimeIndex格式的日期序列,其中参数包括:起始时间start...、结束时间end、时期数量periods、日期间隔频率freq='M’月、'D’天、‘W’、周、'Y’年等等,此处生成从2010-01-01开始的1000个日期的时间序列,如下所示: import pandas...格式的股票交易数据之后,就可以利用Pandas强大数据分析功能处理我们的数据,在后续的小节中会陆续介绍其中的各种方法。...以上就是Pandas的核心—DataFrame数据结构的生成讲解。

1.9K20

7步搞定数据清洗-Python数据清洗指南

尝试去理解这份数据集 我们可以通过对数据集提问来判断这份数据能不能满足解答我们的问题,数据是否干净需不需要进一步处理,问题包括但不限于: 数据集多少数据? 包含了什么字段?字段格式是什么?...发现有很多空格的问题 根据第一步数据预处理后,整理一下该数据集有下列问题需要处理: 1)调整数据类型:由于一开始用到了str来导入,打算后期再更换格式,需要调整数据类型。...日期调整前(为求简便这里用已经剔除分秒,剔除的办法后面在格式一致化的空格分割再详细说) #数据类型转换:字符串转换为日期 #errors='coerce' 如果原始数据不符合日期的格式,转换后的值为空值...日期类型调整后 ? 数据类型调整完毕 三、修改列名 ?...https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.fillna.html#pandas.DataFrame.fillna

4.4K20

Pandas知识点-DataFrame数据结构介绍

一、Pandas简介和安装 Pandas是Python中用于数据处理和数据分析的开源库,2008年由金融数据分析师Wes McKinney开发。...开发Pandas的初衷是为了方便进行金融数据分析,现在Pandas的功能越来越丰富,应用范围也越来越广,几乎所有需要做数据处理的地方都可以派上用场。...使用type()函数打印数据的类型,数据类型DataFrame。说明刚从csv文件中读取出来的数据是一个DataFrame数据。...DataFrame中的数据类型 data = pd.read_csv("600519.csv", encoding='gbk') print(data.dtypes) 日期 object...以上就是PandasDataFrame数据结构的基本介绍。DataFramePandas中最常用的数据结构,大部分方法都是对DataFrame处理,后面会陆续介绍更多相关的属性和方法。

2.3K40
领券