python学习,数据分析系列工具,初识numpy

其实,数据分析看着很高大上,也很实用,但是真的很枯燥啊。。。。但是它又不得不学,毕竟数据分析对很多工作是很有帮助的,比如爬虫,抓到的数据,不论是保存到文件还是数据库,都需要对数据进行清洗、去重等等操作 ,这些和数据分析就密不可分了!

概述

python的数据分析主要用到3个库:numpy、pandas、matplotlib,它们的差别简单的说就是,numpy主要操作数值,pandas操作数值和字符,matplotlib做可视化!

NUMPY(以下简称NP)是Python数据分析必不可少的第三方库,np的出现一定程度上解决了Python运算性能不佳的问题,同时提供了更加精确的数据类型。如今,np被Python其它科学计算包作为基础包,已成为Python 数据分析的基础,可以说,NP是SciPy、Pandas等数据处理或科学计算库最基本的函数功能库。因此,理解np的数据类型对python数据分析十分有帮助。

今天,给大家分享的就是NP的常用操作和基本数据类型

numpy基础操作

安装和导入:

pip install numpy 安装库

导入时直接import numpy,为了方便使用,基本默认用import numpy as np

说到numpy,就不得不说到数组,多维数组的操作,在numpy中是很常见的,而且也很简单(当然需要自身有一定的数学基础哦!)用代码来直接呈现吧

列表或者迭代器都可以直接用array方法传入列表,最终生成1行5列的数组(矩阵),它们都是numpy定义的数据类型

这是一行,也可以生成二维数组

先给lis列表添加2个列表进去,它的格式是【【lis1】,【lis2】】,然后传入a,打印出来就是一个2行5列的数组,当然数据类型是不变的。

既然是多行,那么就可以改变形状了,这里用到了shape(查看)和reshape(修改)数组形状的方法,注意这里的修改形状,不能将2行5列的数组修改为3行5列的数组,只能行和列互换,而且reshape有返回值,不影响原有数据的,看下图

在来一个错误示例

将多种情况都打印出来,就可以看的很明白了!

flatten方法,它可以将多维数组'摊平',这个方法相对重要!同样,它也不影响原有数组

numpy的简单计算及索引与取值

以上我们说到了一些numpy对数组的简单操作,计算部分,就单开一节了。先来几个简单的

数组+1,所有数加1,数组乘3,所有数乘3。而数组的索引与取值,可以对比列表的索引和取值,来进行学习,注意,它的下标依然是从0开始的

而取列就不一样了,比如:a[:,1]表示第二列,在中括号里面的冒号+逗号表示所有行,先看实例:

也可以取指定的行或者列,如下图:

取指定行的话,直接传含有指定行索引的列表进去,取列也一样,不过在前面记得加冒号+逗号。不止只有,还可以取指定行与列交叉部分:

b = a[1:3,2:4],注意,列表中前面的1:3代表行,后面的2:4代表列!取出的值依然是一个numpy的数据类型!

未完待续

以上介绍了一些numpy操作数组的,及它本身的一些基本操作方式,要知道numpy用法很广泛,一篇文章根本写不完,之后会慢慢的分享给大家!

再次重申,数据分析是一个非常枯燥的工作,它比web开发或者爬虫都要枯燥很多,如果您有这方面的学习欲望,且能坚持的话,可以来和我们一起学习哦!

我们要振作精神,下苦功学习。下苦功,三个字,一个叫下,一个叫苦,一个叫功,一定要振作精神,下苦功。 —— 毛泽东

原文发布于微信公众号 - 云飞学python(P542110741)

原文发表时间:2018-08-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Crossin的编程教室

这些年,你们一起踩过的坑(2)

上次我们踩坑总结文章 这些年,你们一起踩过的坑(1) 受到了不少同学的认可。我也确信文中所涉及的问题是非常具有普遍性的,对绝大多数初学者都会有帮助。

1163
来自专栏C/C++基础

C++0x 通用属性

C++在不断的发展,但每一阶段的C++标准提供的功能都很难完全满足现实需求,于是为了弥补标准的不足或者扩增特性应用场景所需的特性,各大C++编译器厂商多多少少在...

1212
来自专栏机器学习算法工程师

一道网易笔试题引发的血案……

作者:柳行刚 编辑:黄俊嘉 网易的2016年笔试题,题目经典。 所以特地找来给各位有兴趣的童鞋看看, 有详细的解题思路以及代码喔~ 各位,请看题! 题目描述: ...

45912
来自专栏AI深度学习求索

算法图解(五)|散列表与字典

我们之前介绍过简单查找和二分查找,简单查找是从头开始一个个查找,二分查找是在有序列表中按分而治之的思想进行查找,虽然二分查找已经很快速了,但是在有些情况下,还是...

1321
来自专栏

shell之sort命令

1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。 [rocro...

2107
来自专栏小樱的经验随笔

51Nod 1182 完美字符串(字符串处理 贪心 Facebook Hacker Cup选拔)

1182 完美字符串 ?             题目来源:                         Facebook Hacker Cup选拔    ...

2937
来自专栏Python小屋

微课系列(四):Python中map对象的几种用法和注意事项

在Python中,map、filter、enumerate、zip、reversed等对象除了惰性求值之外,还有个共同的特点是“其中的元素只能使用一次”,这一点...

842
来自专栏数说工作室

5. call PRXCHANGE() | 移形换影

【SAS Says·扩展篇】移形换影 | 5. call PRXCHANGE() 0. 前集回顾 1. 新的问题 2. 初识 PRXCHANGE() 3. 问题...

3805
来自专栏ACM算法日常

I Hate It!(线段树-超详细~)- HDU 1754

很多学校流行一种比较的习惯。老师们很喜欢询问,从某某到某某当中,分数最高的是多少。 这让很多学生很反感。 不管你喜不喜欢,现在需要你做的是,就是按照老师的要求...

922
来自专栏量化投资与机器学习

【精心解读】用pandas处理大数据——节省90%内存消耗的小贴士

本文我们讨论 pandas 的内存使用,展示怎样简单地为数据列选择合适的数据类型,就能够减少 dataframe 近 90% 的内存占用。

1.8K5

扫码关注云+社区

领取腾讯云代金券