Numpy 修炼之道 (7)—— 形状操作

Numpy 有一个强大之处在于可以很方便的修改生成的N维数组的形状。

更改数组形状

数组具有由沿着每个轴的元素数量给出的形状:

>>> a = np.floor(10*np.random.random((3,4)))
>>> a
array([[ 6.,  7.,  2.,  0.],
       [ 6.,  2.,  0.,  9.],
       [ 3.,  9.,  3.,  8.]])
>>> a.shape
(3L, 4L)

上面生成了一个 3x4 的数组,现在对它进行形状的改变。

>>> a.ravel() # 进行平铺
array([ 6.,  7.,  2.,  0.,  6.,  2.,  0.,  9.,  3.,  9.,  3.,  8.])
>>> a.reshape(2, 6) # 重塑成 2x6
array([[ 6.,  7.,  2.,  0.,  6.,  2.],
       [ 0.,  9.,  3.,  9.,  3.,  8.]])
>>> a.T # 转置
array([[ 6.,  6.,  3.],
       [ 7.,  2.,  9.],
       [ 2.,  0.,  3.],
       [ 0.,  9.,  8.]])
>>> a.shape
(3L, 4L)

无论是ravelreshapeT,它们都不会更改原有的数组形状,都是返回一个新的数组。

使用 resize 方法可以直接修改数组本身:

>>> a
array([[ 6.,  7.,  2.,  0.],
       [ 6.,  2.,  0.,  9.],
       [ 3.,  9.,  3.,  8.]])
>>> a.resize(2, 6)
>>> a
array([[ 6.,  7.,  2.,  0.,  6.,  2.],
       [ 0.,  9.,  3.,  9.,  3.,  8.]])

技巧:在使用 reshape 时,可以将其中的一个维度指定为 -1,Numpy 会自动计算出它的真实值

>>> a.reshape(3, -1)
array([[ 6.,  7.,  2.,  0.],
       [ 6.,  2.,  0.,  9.],
       [ 3.,  9.,  3.,  8.]])

将不同数组堆叠在一起

除了可以对单个数组的形状进行转换外,还可以把多个数据进行堆叠。

>>> a = np.floor(10*np.random.random((2,2)))
>>> a
array([[ 9.,  9.],
       [ 8.,  1.]])
>>> b = np.floor(10*np.random.random((2,2)))
>>> b
array([[ 5.,  2.],
       [ 9.,  5.]])
>>> np.vstack((a,b))
array([[ 9.,  9.],
       [ 8.,  1.],
       [ 5.,  2.],
       [ 9.,  5.]])
>>> np.hstack((a,b))
array([[ 9.,  9.,  5.,  2.],
       [ 8.,  1.,  9.,  5.]])

对于2D数组来说,使用hstackcolumn_stack 效果一样,对于1D数组来说,column_stack 会将1D数组作为列堆叠到2D数组中:

>>> from numpy import newaxis
>>> np.column_stack((a,b))     # with 2D arrays
array([[ 4.,  3.],
       [ 2.,  8.]])
>>> a = np.array([4.,2.])
>>> b = np.array([3.,8.])
>>> np.column_stack((a,b))
array([[ 4.,  3.],
       [ 2.,  8.]])
>>> np.hstack((a,b))           # 一维数组的情况下,column_stack和hstack结果不一样
array([ 4.,  2.,  3.,  8.])
>>> a[:,newaxis]               # 将一维数组转为二维数组
array([[ 4.],
       [ 2.]])
>>> np.column_stack((a[:,newaxis],b[:,newaxis]))
array([[ 4.,  3.],
       [ 2.,  8.]])
>>> np.hstack((a[:,newaxis],b[:,newaxis]))   # 二维数组的情况下,column_stack和hstack结果一样
array([[ 4.,  3.],
       [ 2.,  8.]])

另一方面,对于任何输入数组,函数row_stack等效于vstack。一般来说,对于具有两个以上维度的数组,hstack沿第二轴堆叠,vstack沿第一轴堆叠,concatenate允许一个可选参数,给出串接应该发生的轴。

将一个数组分成几个较小的数组

既然可以将多个数组进行对堆叠,自然也可以将一个数组拆分成多个小数组。

使用hsplit,可以沿其水平轴拆分数组,通过指定要返回的均匀划分的数组数量,或通过指定要在其后进行划分的列:

>>> from pprint import pprint
>>> a = np.floor(10*np.random.random((2,12)))
>>> a
array([[ 9.,  3.,  4.,  1.,  0.,  0.,  6.,  7.,  3.,  4.,  1.,  1.],
       [ 1.,  2.,  8.,  1.,  0.,  2.,  1.,  4.,  3.,  8.,  1.,  1.]])
>>> pprint(np.hsplit(a,3))   # 水平切成3等份
[array([[ 9.,  3.,  4.,  1.],
       [ 1.,  2.,  8.,  1.]]),
 array([[ 0.,  0.,  6.,  7.],
       [ 0.,  2.,  1.,  4.]]),
 array([[ 3.,  4.,  1.,  1.],
       [ 3.,  8.,  1.,  1.]])]

vsplit沿垂直轴分割,array_split允许指定沿哪个轴分割。

作者:无邪,个人博客:脑洞大开,专注于机器学习研究。

原文发布于微信公众号 - 脑洞科技栈(naodong-open)

原文发表时间:2018-03-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏尾尾部落

[剑指offer] 数值的整数次方 [剑指offer] 数值的整数次方

给定一个double类型的浮点数base和int类型的整数exponent。求base的exponent次方。

9330
来自专栏编程

扣丁学堂浅谈Python视频教程之random模块详解

今天扣丁学堂小编给大家详细介绍一下关于Python视频教程之random模块详解,,首先用于生成伪随机数之所以称之为伪随机数,是因为真正意义上的随机数(或者随机...

238100
来自专栏Bingo的深度学习杂货店

最小方差划分

给一个数组,求一个k值,使得前k个数的方差 + 后面n-k个数的方差最小 解题思路: 如果不考虑方差的概念,这题可以简化为 “给一个数组,求一个k值,使得前k个...

58330
来自专栏郭耀华‘s Blog

TensorFlow 常用函数汇总

83220
来自专栏数据结构与算法

27:单词翻转

27:单词翻转 总时间限制: 1000ms 内存限制: 65536kB描述 输入一个句子(一行),将句子中的每一个单词翻转后输出。 输入只有一行,为一个...

43770
来自专栏数据结构与算法

拉格朗日插值

存在性和唯一性的证明以后再补。。。。 拉格朗日插值 拉格朗日插值,emmmm,名字挺高端的:joy: 它有什么应用呢? 我们在FFT中讲到过 设n-1次多项式为...

30570
来自专栏10km的专栏

faster rcnn:assert (boxes[:, 2] >= boxes[:, 0]).all()分析塈VOC2007 xml坐标定义理解

在进行faster rcnn训练的时候,报了一个断言错误 File “/py-faster-rcnn/tools/../lib/datasets/imdb.p...

52350
来自专栏崔庆才的专栏

Attention原理及TensorFlow AttentionWrapper源码解析

3.4K40
来自专栏python读书笔记

《python算法教程》Day10 - 平面最近点对问题平面最小点对问题介绍代码演示

今天是《python算法教程》的第10篇读书笔记。笔记的主要内容是使用python实现求最小点对的时间复杂度为O(nlogn)的算法。 平面最小点对问题介绍 在...

749120
来自专栏数据结构与算法

P1378 油滴扩展

题目描述 在一个长方形框子里,最多有N(0≤N≤6)个相异的点,在其中任何一个点上放一个很小的油滴,那么这个油滴会一直扩展,直到接触到其他油滴或者框子的边界。必...

29180

扫码关注云+社区

领取腾讯云代金券