DataFrame初识(Pandas读书笔记5)

Series是一列有序号的数据,DataFrame就是N列有序号的数据。DataFrame含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。长得样子很像我们平时使用的Excel数据(前提你的Excel是规范的表)。

一、创建一个DataFrame

不知各位朋友有没有注意到一个细节,data字典表赋值的时候是name、age、score,但是生成DataFrame后顺序变了!还有重复说明一个概念,字典的数据是无序的!

二、人为定义列的顺序

在生成DataFrame时增加一个参数columns就可以规定生成的数据列的顺序了!

默认的行的序号是0起始的增序,如果想变更或自定义也是可以的。

三、自定义行序号

与Series数据类型一致,增加一个index参数即可!

四、NA数据介绍

当我们多定义了一个列的时候,由于原有data并没有存储class的数据,所以就用了NaN进行存储代替。

NaN是代表缺失数据,后期pandas读取文件的时候,经常会因为编码问题,原数据问题导致部分数据缺失。知道NaN是什么意思即可。

原文发布于微信公众号 - 阿凯的Excel(akexcel)

原文发表时间:2018-02-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java相关

设计模式之—代理模式

其中Spring的AOP是典型的动态代理模式 下面我们以网络连接中的代理为例说明动态代理,类图如下:

862
来自专栏Java编程技术

并发队列-无界阻塞队列LinkedBlockingQueue原理探究

前面介绍了使用CAS实现的非阻塞队列ConcurrentLinkedQueue,下面就来介绍下使用独占锁实现的阻塞队列LinkedBlockingQueue的实...

1163
来自专栏Android小菜鸡

时间选择器TimePickerDialog

  TimePickerDialog是一个android自带的为设置时间而提供的Dialog,使用起来简单,上手快。时常配合Canlendar一起使用。

1212
来自专栏顶级程序员

让人疑惑的代码,竟成大多公司面试题热门!

? 小编今天给大家看的这个笔试题 当年可是火遍大江南北 不妨你先看看到底会不会 这是关于一段令人疑惑的Java代码 真题在此,谁敢不服 ▼ ? 你觉得简单,那...

3446
来自专栏Java编程技术

并发队列-有界阻塞队列ArrayBlockingQueue原理探究

上节介绍了无界链表方式的阻塞队列LinkedBlockingQueue,本节来研究下有界使用数组方式实现的阻塞队列ArrayBlockingQueue

811
来自专栏Java技术分享

第三章:Shiro的配置——深入浅出学Shiro细粒度权限开发框架

Shiro 被设计成能够在任何环境下工作,从最简单的命令行应用程序到最大的的企业群集应用。由于环境的多样性,使得许多配置机制适用于它的配置。

2438
来自专栏Java架构沉思录

Java并发编程之阻塞队列

使用非阻塞队列的时候有一个很大问题就是:它不会对当前线程产生阻塞,那么在面对类似消费者-生产者的模型时,就必须额外地实现同步策略以及线程间唤醒策略,这个实现起来...

912
来自专栏对角另一面

读Zepto源码之Callbacks模块

Callbacks 模块并不是必备的模块,其作用是管理回调函数,为 Defferred 模块提供支持,Defferred 模块又为 Ajax 模块的 promi...

2130
来自专栏深度学习之tensorflow实战篇

mongodb取出json,利用python转成dataframe(dict-to-dataframe)

mongodb取出json,利用python转成dataframe(dict-to-dataframe) 1、mongodb数据源结构: ? 2...

4054
来自专栏牛肉圆粉不加葱

Spark Storage ④ - 存储执行类介绍(DiskBlockManager、DiskStore、MemoryStore)

这篇文章前半部分我们对直接在 Block 存取发挥重要作用的类进行介绍,主要是 DiskBlockManager、MemoryStore、DiskStore。后...

882

扫码关注云+社区