数据分析 Numpy初窥1

Numpy这一块知识点技术公式比较多,死记硬背肯定是非常枯燥的,我不建议大家去死记硬背,我更建议大家去做一个自己的知识网络图. 不清楚的时候就去查资料. 另外所有的知识点我建议大家先去看一下书,再回头动手!

发招了

Numpy 是高性能科学计算和数据分析的基础包,它有的部分功能如下

ndarray,一个具有失量算术运算和复杂广播能力的快速且节省空间的多维数组

用于对整组数据进行快速运算的标准数学函数

用于读写磁盘数据的工具以及用于操作内在映射文件的工具

线性代数,随机数生成以及傅里叶变换功能

用于集成C,C++,Python等语言编写的代码的工具

由于Numpy提供了一个简单易用的C API,因此很容易将数据传输给由低级语言编写的外部库,外部库也能以Numpy数组的形式将数据返回给Python

对于大部分数据分析应而言,关注的功能主要集中于

用于数据整理和清理,子集构造和过滤,转换等快速的失量化数组运算

常用的数组算法,如排序,唯一化,集合运算等

高效的描述统计和数据聚合/摘要运算

用于异构数据集的合并/连接运算的数据对齐和关系型数据运算

将条件逻辑表述为数组表达式(不是if else等分支的循环)

数据的分组运算(聚合,转换,函数应用等)

按照标准Numpy约定,我们使用numpy库 都有是这样的调用的

Numpy的ndarray:一种多维数组对象

Numpy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器.

ndarray 是一个通用的同构数据多维容器,也就是说,其中所有的元素必须是相同类型的,每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数据类型的对象)

这里我是使用jupyter notebook的环境进行操作,而且我是强烈建议是使用这个工具.我在上一篇文章有介绍这个工具的基本使用了,详细了解可以移步:

Python数据分析之旅: 前戏

ndarray的创建,以及元组的数据类型

Python的运算

这里是一一对应的失量运算,后面矩阵也会用到,更复杂,建议不懂的朋友,需要自行复习一下线性代数

说明:后面教程的代码我都是用截图形式呈现,因为这个每一行代码,每一行代码的去处结果都能非常直观的呈现.所以我是强烈建议使用jupyter notebook.这个工具.In 是我们输入的代码, out是代码输出的结果

下一篇Numpy初窥2,欢迎持续关注~

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181011G021TY00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券