Python数据处理(6)-pandas的数据结构

pandas是本系列后续内容所需要的第三方库,它是基于之前介绍的NumPy构建的,使得Python可以更加简单、方便地完成一系列数据分析工作。

首先,使用下面的pandas导入约定:

pd是pandas约定俗成的缩写,Series和DataFrame是pandas中两个最重要的数据结构。我们将简单介绍二者的用法,作为pandas的入门。

1.Series

Series是一种类似于一维数组的对象,它由一组数据(NumPy数组)以及相对应的一组数组标签(即索引)构成。

其中,左边是索引部分,右边是数据部分。由于创建Series时没有给定索引参数,于是默认索引为0到N-1。

通过Series的values和index属性,可以获取数据数组和索引数组。

我们可以通过传入索引参数对数据进行标记,然后就可以通过索引获取对应的数据点,这一点类似于字典数据结构。

和NumPy中介绍的很多操作类似,Series同样可以进行布尔值索引和矢量化操作。

2.DataFrame

DataFrame是Pandas数据分析中最常用和最重要的数据结构,它是一个表格型的数据结构,这一点与Excel表格十分类似,每个数据点既有行索引又有列索引。

创建DataFrame最常用的一种方法就是传入一个由等长列表组成的字典。

结果DataFrame会自动加上索引(跟Series类似), 并且全部列都会有序排列。

我们可以通过传入列索引(即属性)的方式获取Series或者DataFrame子列表。

和Series一样,我们也可以传入索引参数或者设定一个属性为索引。

本文来自企鹅号 - 全球大搜罗媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java与Android技术栈

Scala学习笔记(四) 类的初步Scala 类相关总结

终于来到面向对象的地方了,虽说函数式编程是 Scala 的特性,让人们觉得 Scala 是更好的 Java。但是在架构层面上一直提倡着:小处用函数式编程,大处用...

1102
来自专栏小小挖掘机

来学习几个简单的Hive函数啦

咳咳,今天来介绍一下几个Hive函数吧,先放一张我登哥划水的照片,希望大家也做一只自由的鱼儿,在知识的海洋里游呀游,嘻嘻! ? 今天我们来介绍几个Hive常用的...

4334
来自专栏CoXie带你学编程

8个Python高效数据分析的技巧

厌倦了定义用不了几次的函数? Lambda表达式是你的救星! Lambda表达式用于在Python中创建小型,一次性和匿名函数对象。 它能替你创建一个函数。

1062
来自专栏王硕

原 PostgreSQL的系统函数分析记录

1303
来自专栏LhWorld哥陪你聊算法

Pandas库的使用--Series

1462
来自专栏编程微刊

Pandas的数据结构Pandas的数据结构

1022
来自专栏机器学习和数学

[编程经验] Pandas入门(二)

上次介绍了Pandas的部分操作,包括创建Series,DataFrame以及基本索引,文件保存与读取等。今天我们介绍一下Pandas常用的其他功能。 首先我们...

3815
来自专栏深度学习自然语言处理

python科学计算之Pandas使用(一)

Pandas 是基于 NumPy 的一个非常好用的库,正如名字一样,人见人爱。之所以如此,就在于不论是读取、处理数据,用它都非常简单。

912
来自专栏博客园

Core官方DI解析(4)--CallSiteRuntimeResolver

这两个类都在其CallSiteVisitor<TArgument, TResult>基类中

863
来自专栏博客园

Core官方DI解析(4)--CallSiteRuntimeResolver

​ CallSiteRuntimeResolver类型是一个创建或获取服务实例的类型,这个类型继承了CallSiteVisitor<TArgument, TRe...

951

扫码关注云+社区

领取腾讯云代金券