DataFrame初识(Pandas读书笔记5)

Series是一列有序号的数据,DataFrame就是N列有序号的数据。DataFrame含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。长得样子很像我们平时使用的Excel数据(前提你的Excel是规范的表)。

一、创建一个DataFrame

不知各位朋友有没有注意到一个细节,data字典表赋值的时候是name、age、score,但是生成DataFrame后顺序变了!还有重复说明一个概念,字典的数据是无序的!

二、人为定义列的顺序

在生成DataFrame时增加一个参数columns就可以规定生成的数据列的顺序了!

默认的行的序号是0起始的增序,如果想变更或自定义也是可以的。

三、自定义行序号

与Series数据类型一致,增加一个index参数即可!

四、NA数据介绍

当我们多定义了一个列的时候,由于原有data并没有存储class的数据,所以就用了NaN进行存储代替。

NaN是代表缺失数据,后期pandas读取文件的时候,经常会因为编码问题,原数据问题导致部分数据缺失。知道NaN是什么意思即可。

原文发布于微信公众号 - 阿凯的Excel(akexcel)

原文发表时间:2018-02-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏java一日一条

8种常见的Java不规范代码

在工作上,我最近对一个现有的Java项目代码进行了清理。完成之后,我发现了一些反复出现的不规范代码。所以,我把它们整理成了一个列表出来分享给我的同行希望能引起注...

561
来自专栏机器学习算法与Python学习

pandas入门教程

pandas是一个Python语言的软件包,在我们使用Python语言进行机器学习编程的时候,这是一个非常常用的基础编程库。本文是对它的一个入门教程。

682
来自专栏技巅

Redis第一个版本源码分析-启动过程分析1

1705
来自专栏程序员阿凯

ClassNotFoundException 和 NoClassDefFoundError 的区别

1556
来自专栏owent

C++11动态模板参数和type_traits

C++11标准里有动态模板参数已经是众所周知的事儿了。但是当时还有个主流编译器还不支持。 但是现在,主要的编译器。VC(Windows),GCC(Window...

622
来自专栏java达人

硬编码,常量,枚举类

假如有一笔业务需要审核,审核状态分:未审核,审核中,审核通过,审核不通过。我们在程序里是否可以直接这么写: if(state==1){//1代表未操作 //...

1866
来自专栏Python绿色通道

Python入门三部曲(三)

在函数greet_user()中,变量username是一个形参—-函数完成其工作所需要的一项信息.在代码greet_user(‘kobe’)中,值’kobe’...

783
来自专栏杨建荣的学习笔记

awk中的变量(r4笔记第93天)

awk和sed结合起来,对于文件的横向纵向处理几乎是全方位的,可以算是文本处理中的大招了。当然awk这一强大的分本处理工具也不是浪得虚名,功能丰富,学习周期也要...

3367
来自专栏java一日一条

8种常见的Java不规范代码

在工作上,我最近对一个现有的Java项目代码进行了清理。完成之后,我发现了一些反复出现的不规范代码。所以,我把它们整理成了一个列表出来分享给我的同行希望能引起注...

401
来自专栏草根专栏

.NET Core TDD 前传: 编写易于测试的代码 -- 构建对象

本文是第2篇, 介绍的是如何避免在构建对象时写出不易测试的代码. 本文的概念性内容大部分都来自Misko Hevery的这篇博客文章.

922

扫码关注云+社区