数据分析 | Numpy初窥1

Numpy这一块知识点技术公式比较多,死记硬背肯定是非常枯燥的,我不建议大家去死记硬背,我更建议大家去做一个自己的知识网络图. 不清楚的时候就去查资料. 另外所有的知识点我建议大家先去看一下书,再回头动手!

大家可以阅读原文使用我的链接来体验这个思维导图

发招了

Numpy 是高性能科学计算和数据分析的基础包,它有的部分功能如下

  • ndarray,一个具有失量算术运算和复杂广播能力的快速且节省空间的多维数组
  • 用于对整组数据进行快速运算的标准数学函数
  • 用于读写磁盘数据的工具以及用于操作内在映射文件的工具
  • 线性代数,随机数生成以及傅里叶变换功能
  • 用于集成C,C++,Python等语言编写的代码的工具

由于Numpy提供了一个简单易用的C API,因此很容易将数据传输给由低级语言编写的外部库,外部库也能以Numpy数组的形式将数据返回给Python

对于大部分数据分析应而言,关注的功能主要集中于

  • 用于数据整理和清理,子集构造和过滤,转换等快速的失量化数组运算
  • 常用的数组算法,如排序,唯一化,集合运算等
  • 高效的描述统计和数据聚合/摘要运算
  • 用于异构数据集的合并/连接运算的数据对齐和关系型数据运算
  • 将条件逻辑表述为数组表达式(不是if else等分支的循环)
  • 数据的分组运算(聚合,转换,函数应用等)

按照标准Numpy约定,我们使用numpy库 都有是这样的调用的import numpy as np

Numpy的ndarray:一种多维数组对象

Numpy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器.

ndarray 是一个通用的同构数据多维容器,也就是说,其中所有的元素必须是相同类型的,每个数组都有一个shape(一个表示各维度大小的元组)和一个dtype(一个用于说明数据类型的对象)

这里我是使用jupyter notebook的环境进行操作,而且我是强烈建议是使用这个工具. 我在上一篇文章有介绍这个工具的基本使用了,详细了解可以移步:Python数据分析之旅: 前戏

ndarray的创建,以及元组的数据类型

Python的运算

这里是一一对应的失量运算,后面矩阵也会用到,更复杂,建议不懂的朋友,需要自行复习一下线性代数

说明:后面教程的代码我都是用截图形式呈现,因为这个每一行代码,每一行代码的去处结果都能非常直观的呈现.所以我是强烈建议使用jupyter notebook.这个工具. In 是我们输入的代码, out是代码输出的结果

本文分享自微信公众号 - Python绿色通道(Future_coder)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-10-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏chenjx85的技术专栏

leetcode-167-Two Sum II-Input array is sorted

23440
来自专栏java技术学习之道

海量数据处理 - 找出最大的n个数(top K问题)

74040
来自专栏Danny的专栏

UML图——类图

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/...

69820
来自专栏Java技术栈

进阶 | Java生成随机数的几种高级用法!

40330
来自专栏架构说

最短路径问题

第一题:求不重复路径的个数 How many possible unique paths are there A robot is located at th...

407140
来自专栏用户2442861的专栏

2012年10月9号阿里巴巴笔试(c++)

http://blog.csdn.net/liuzhanchen1987/article/details/8058177#comments

13020
来自专栏Java帮帮-微信公众号-技术文章全总结

十道海量数据处理面试题与十个方法总结 【面试+提高】

十道海量数据处理面试题与十个方法总结 一、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。   此题,在我之前的一篇文章算法里头...

1K80
来自专栏轮子工厂

程序员必读:教你摸清哈希表的脾气

在哈希表中,记录的存储位置 = f (关键字),通过查找关键字的存储位置即可,不用进行比较。散列技术是在记录的存储位置和它的关键字之间建立一个明确的对应关系f ...

10120
来自专栏Crossin的编程教室

【每周一坑】生成词云

来看本周的题目。 使用 wordcloud 生成词云图 ? 在 Python 中有许多有趣的库可供学习, wordcloud 必须得算一个,本周我们的题目就是,...

393110
来自专栏醒者呆

由查找算法工程的类图分析组合模式

关键字:算法工程的类图,架构分析,设计模式,组合模式 首先,上一个我刚完成的针对上一篇Knowledge_SPA——精研查找算法文中使用的工程,所画的类图...

37270

扫码关注云+社区

领取腾讯云代金券