前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Numpy实战全集

Numpy实战全集

作者头像
公众号guangcity
发布2019-09-20 14:36:41
2.1K0
发布2019-09-20 14:36:41
举报
文章被收录于专栏:光城(guangcity)光城(guangcity)

Numpy实战全集

0.导语1.Numpy基本操作1.1 列表转为矩阵1.2 维度1.3 行数和列数()1.4 元素个数2.Numpy创建array2.1 一维array创建2.1 多维array创建2.2 创建全零数组2.3 创建全一数据2.4 创建全空数组2.5 创建连续数组2.6 reshape操作2.7 创建连续型数据2.8 linspace的reshape操作3.Numpy基本运算3.1 一维矩阵运算3.2 多维矩阵运算3.3 基本计算4.Numpy索引与切片5.Numpy array合并5.1 数组合并5.2 数组转置为矩阵5.3 多个矩阵合并5.4 合并例子26.Numpy array分割6.1 构造3行4列矩阵6.2 等量分割6.3 不等量分割6.4 其他的分割方式7.Numpy copy与 =7.1 =赋值方式会带有关联性7.2 copy()赋值方式没有关联性8.广播机制9.常用函数

0.导语

好久没来长文了,今天来一篇年终代码长文,大家都知道numpy多么重要,那么看完这一篇你将学到numpy的基本常用操作,下面一起来看吧,如果你觉得本公众号对您有帮助,欢迎转发支持,谢谢!!!

1.Numpy基本操作

1.1 列表转为矩阵

import numpy as np
array = np.array([
    [1,3,5],
    [4,6,9]
])

print(array)

输出:

[[1 3 5]
 [4 6 9]]

1.2 维度

print('number of dim:', array.ndim)

输出:

number of dim: 2

1.3 行数和列数()

print('shape:',array.shape)

输出:

shape: (2, 3)

1.4 元素个数

print('size:',array.size)

输出:

size:6

2.Numpy创建array

2.1 一维array创建

import numpy as np
# 一维array
a = np.array([2,23,4], dtype=np.int32) # np.int默认为int32
print(a)
print(a.dtype)

输出:

[ 2 23  4]
int32

2.1 多维array创建

# 多维array
a = np.array([[2,3,4],
              [3,4,5]])
print(a) # 生成2行3列的矩阵

输出:

[[2 3 4]
 [3 4 5]]

2.2 创建全零数组

a = np.zeros((3,4))
print(a) # 生成3行4列的全零矩阵

输出:

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

2.3 创建全一数据

# 创建全一数据,同时指定数据类型
a = np.ones((3,4),dtype=np.int)
print(a)

输出:

[[1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]]

2.4 创建全空数组

# 创建全空数组,其实每个值都是接近于零的数
a = np.empty((3,4))
print(a)

输出:

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

2.5 创建连续数组

# 创建连续数组
a = np.arange(10,21,2) # 10-20的数据,步长为2
print(a)

输出:

[10 12 14 16 18 20]

2.6 reshape操作

# 使用reshape改变上述数据的形状
b = a.reshape((2,3))
print(b)

输出:

[[10 12 14]
 [16 18 20]]

2.7 创建连续型数据

# 创建线段型数据
a = np.linspace(1,10,20) # 开始端1,结束端10,且分割成20个数据,生成线段
print(a)

输出:

[ 1.          1.47368421  1.94736842  2.42105263  2.89473684  3.36842105
  3.84210526  4.31578947  4.78947368  5.26315789  5.73684211  6.21052632
  6.68421053  7.15789474  7.63157895  8.10526316  8.57894737  9.05263158
  9.52631579 10.        ]

2.8 linspace的reshape操作

# 同时也可以reshape
b = a.reshape((5,4))
print(b)

输出:

[[ 1.          1.47368421  1.94736842  2.42105263]
 [ 2.89473684  3.36842105  3.84210526  4.31578947]
 [ 4.78947368  5.26315789  5.73684211  6.21052632]
 [ 6.68421053  7.15789474  7.63157895  8.10526316]
 [ 8.57894737  9.05263158  9.52631579 10.        ]]

3.Numpy基本运算

3.1 一维矩阵运算

import numpy as np
# 一维矩阵运算
a = np.array([10,20,30,40])
b = np.arange(4)
print(a,b)
# [10 20 30 40] [0 1 2 3]
c = a - b
print(c)
# [10 19 28 37]
print(a*b) # 若用a.dot(b),则为各维之和
# [  0  20  60 120]
# 在Numpy中,想要求出矩阵中各个元素的乘方需要依赖双星符号 **,以二次方举例,即:
c = b**2
print(c)
# [0 1 4 9]
# Numpy中具有很多的数学函数工具
c = np.sin(a)
print(c)
# [-0.54402111  0.91294525 -0.98803162  0.74511316]
print(b<2)
# [ True  True False False]
a = np.array([1,1,4,3])
b = np.arange(4)
print(a==b)
# [False  True False  True]

3.2 多维矩阵运算

a = np.array([[1,1],[0,1]])
b = np.arange(4).reshape((2,2))
print(a)
'''
[[1 1]
 [0 1]]
'''
print(b)
'''
[[0 1]
 [2 3]]
'''
# 多维度矩阵乘法
# 第一种乘法方式:
c = a.dot(b)
print(c)
# 第二种乘法:
c = np.dot(a,b)
print(c)
'''
[[2 4]
 [2 3]]
'''
# 多维矩阵乘法不能直接使用'*'号

a = np.random.random((2,4))

print(np.sum(a)) # 3.657010765991042
print(np.min(a)) # 0.10936760904735132
print(np.max(a)) # 0.9476048882750654

print("a=",a)
'''
a= [[0.16607436 0.94760489 0.59649117 0.22698245]
 [0.66494464 0.23447984 0.10936761 0.71106581]]
'''

print("sum=",np.sum(a,axis=1)) # sum= [1.93715287 1.7198579 ]
print("min=",np.min(a,axis=0)) # min= [0.16607436 0.23447984 0.10936761 0.22698245]
print("max=",np.max(a,axis=1)) # max= [0.94760489 0.71106581]

'''
如果你需要对行或者列进行查找运算,
就需要在上述代码中为 axis 进行赋值。
当axis的值为0的时候,将会以列作为查找单元,
当axis的值为1的时候,将会以行作为查找单元。
'''

3.3 基本计算

import numpy as np

A = np.arange(2,14).reshape((3,4))
print(A)

# 最小元素索引
print(np.argmin(A)) # 0
# 最大元素索引
print(np.argmax(A)) # 11
# 求整个矩阵的均值
print(np.mean(A)) # 7.5
print(np.average(A)) # 7.5
print(A.mean()) # 7.5
# 中位数
print(np.median(A)) # 7.5
# 累加
print(np.cumsum(A))
# [ 2  5  9 14 20 27 35 44 54 65 77 90]
# 累差运算
B = np.array([[3,5,9],
              [4,8,10]])
print(np.diff(B))
'''
[[2 4]
 [4 2]]
'''
C = np.array([[0,5,9],
              [4,0,10]])
print(np.nonzero(B))
print(np.nonzero(C))
'''
# 将所有非零元素的行与列坐标分割开,重构成两个分别关于行和列的矩阵
(array([0, 0, 0, 1, 1, 1], dtype=int64), array([0, 1, 2, 0, 1, 2], dtype=int64))
(array([0, 0, 1, 1], dtype=int64), array([1, 2, 0, 2], dtype=int64))
'''
# 仿照列表排序
A = np.arange(14,2,-1).reshape((3,4)) # -1表示反向递减一个步长
print(A)
'''
[[14 13 12 11]
 [10  9  8  7]
 [ 6  5  4  3]]
'''
print(np.sort(A))
'''
# 只是对每行进行递增排序
[[11 12 13 14]
 [ 7  8  9 10]
 [ 3  4  5  6]]
'''
# 矩阵转置
print(np.transpose(A))
'''
[[14 10  6]
 [13  9  5]
 [12  8  4]
 [11  7  3]]
'''
print(A.T)
'''
[[14 10  6]
 [13  9  5]
 [12  8  4]
 [11  7  3]]
'''
print(A)
print(np.clip(A,5,9))
'''
clip(Array,Array_min,Array_max)
将Array_min<X<Array_max  X表示矩阵A中的数,如果满足上述关系,则原数不变。
否则,如果X<Array_min,则将矩阵中X变为Array_min;
如果X>Array_max,则将矩阵中X变为Array_max.
[[9 9 9 9]
 [9 9 8 7]
 [6 5 5 5]]
'''

4.Numpy索引与切片

import numpy as np
A = np.arange(3,15)
print(A)
# [ 3  4  5  6  7  8  9 10 11 12 13 14]
print(A[3])
# 6
B = A.reshape(3,4)
print(B)
'''
[[ 3  4  5  6]
 [ 7  8  9 10]
 [11 12 13 14]]
'''
print(B[2])
# [11 12 13 14]
print(B[0][2])
# 5
print(B[0,2])
# 5
# list切片操作
print(B[1,1:3]) # [8 9] 1:3表示1-2不包含3

for row in B:
    print(row)

'''
[3 4 5 6]
[ 7  8  9 10]
[11 12 13 14]
'''
# 如果要打印列,则进行转置即可
for column in B.T:
    print(column)
'''
[ 3  7 11]
[ 4  8 12]
[ 5  9 13]
[ 6 10 14]
'''
# 多维转一维
A = np.arange(3,15).reshape((3,4))
# print(A)
print(A.flatten())
# flat是一个迭代器,本身是一个object属性
for item in A.flat:
    print(item)

5.Numpy array合并

5.1 数组合并

import numpy as np
A = np.array([1,1,1])
B = np.array([2,2,2])
print(np.vstack((A,B)))
# vertical stack 上下合并,对括号的两个整体操作。
'''
[[1 1 1]
 [2 2 2]]
'''
C = np.vstack((A,B))
print(C)
print(A.shape,B.shape,C.shape)
# (3,) (3,) (2, 3)
# 从shape中看出A,B均为拥有3项的数组(数列)
# horizontal stack左右合并
D = np.hstack((A,B))
print(D)
# [1 1 1 2 2 2]
print(A.shape,B.shape,D.shape)
# (3,) (3,) (6,)
# 对于A,B这种,为数组或数列,无法进行转置,需要借助其他函数进行转置

5.2 数组转置为矩阵

print(A[np.newaxis,:]) # [1 1 1]变为[[1 1 1]]
print(A[np.newaxis,:].shape) # (3,)变为(1, 3)
print(A[:,np.newaxis])
'''
[[1]
 [1]
 [1]]
'''

5.3 多个矩阵合并

# concatenate的第一个例子
print("------------")
print(A[:,np.newaxis].shape) # (3,1)
A = A[:,np.newaxis] # 数组转为矩阵
B = B[:,np.newaxis] # 数组转为矩阵
# axis=0纵向合并
C = np.concatenate((A,B,B,A),axis=0)
print(C)
'''
[[1]
 [1]
 [1]
 [2]
 [2]
 [2]
 [2]
 [2]
 [2]
 [1]
 [1]
 [1]]
'''
# axis=1横向合并
C = np.concatenate((A,B),axis=1)
print(C)
'''
[[1 2]
 [1 2]
 [1 2]]
'''

5.4 合并例子2

# concatenate的第二个例子
print("-------------")
a = np.arange(8).reshape(2,4)
b = np.arange(8).reshape(2,4)
print(a)
print(b)
print("-------------")
# axis=0多个矩阵纵向合并
c = np.concatenate((a,b),axis=0)
print(c)
# axis=1多个矩阵横向合并
c = np.concatenate((a,b),axis=1)
print(c)
'''
[[0 1 2 3]
 [4 5 6 7]
 [0 1 2 3]
 [4 5 6 7]]
[[0 1 2 3 0 1 2 3]
 [4 5 6 7 4 5 6 7]]
'''

6.Numpy array分割

6.1 构造3行4列矩阵

import numpy as np
A = np.arange(12).reshape((3,4))
print(A)
'''
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
'''

6.2 等量分割

# 等量分割
# 纵向分割同横向合并的axis
print(np.split(A, 2, axis=1))
'''
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]
'''
# 横向分割同纵向合并的axis
print(np.split(A,3,axis=0))
# [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]

6.3 不等量分割

print(np.array_split(A,3,axis=1))
'''
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2],
       [ 6],
       [10]]), array([[ 3],
       [ 7],
       [11]])]
'''

6.4 其他的分割方式

# 横向分割
print(np.vsplit(A,3)) # 等价于print(np.split(A,3,axis=0))
# [array([[0, 1, 2, 3]]), array([[4, 5, 6, 7]]), array([[ 8,  9, 10, 11]])]
# 纵向分割
print(np.hsplit(A,2)) # 等价于print(np.split(A,2,axis=1))
'''
[array([[0, 1],
       [4, 5],
       [8, 9]]), array([[ 2,  3],
       [ 6,  7],
       [10, 11]])]
'''

7.Numpy copy与 =

7.1 =赋值方式会带有关联性

import numpy as np
# `=`赋值方式会带有关联性
a = np.arange(4)
print(a) # [0 1 2 3]

b = a
c = a
d = b
a[0] = 11
print(a) # [11  1  2  3]
print(b) # [11  1  2  3]
print(c) # [11  1  2  3]
print(d) # [11  1  2  3]
print(b is a) # True
print(c is a) # True
print(d is a) # True

d[1:3] = [22,33]
print(a) # [11 22 33  3]
print(b) # [11 22 33  3]
print(c) # [11 22 33  3]

7.2 copy()赋值方式没有关联性

a = np.arange(4)
print(a) # [0 1 2 3]
b =a.copy() # deep copy
print(b) # [0 1 2 3]
a[3] = 44
print(a) # [ 0  1  2 44]
print(b) # [0 1 2 3]

# 此时a与b已经没有关联

8.广播机制

numpy数组间的基础运算是一对一,也就是a.shape==b.shape,但是当两者不一样的时候,就会自动触发广播机制,如下例子:

from numpy import array
a = array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b = array([0,1,2])
print(a+b)

输出:

[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]

为什么是这个样子?

这里以tile模拟上述操作,来回到a.shape==b.shape情况!

# 对[0,1,2]行重复3次,列重复1次
b = np.tile([0,1,2],(4,1))
print(a+b)

输出:

[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]

到这里,我们来给出一张图:

是不是任何情况都可以呢?

当然不是,只有当两个数组的trailing dimensions compatible时才会触发广播,否则报错ValueError: frames are not aligned exception

上面表达意思是尾部维度必须兼容

尾部维度:

将多维数组右对齐!能够上下对应,这部分就是尾部,而对应的头部维度,则是维度大的数组比维度小的数组多出来的维度!如下面实际例子:

             axis:   0     1   2
a      (3d array): 256 x 256 x 3
b      (2d array):       256 x 3
a + b  (2d array): 256 x 256 x 3

兼容

they are equal, or one of them is 1

兼容两层意思,深入研究,第一:they are equal

尾部维度相等!

             axis:   0     1   2
a      (3d array): 256 x 256 x 3
b      (2d array):       256 x 3
a + b  (2d array): 256 x 256 x 3

第二:one of them is 1

像下面这个尾部维度不等,但是a或者b对应的元素有1存在,那么也满足兼容性!

             axis:   0     1   2
a      (3d array): 256 x 256 x 1
b      (2d array):        1  x 3
a + b  (2d array): 256 x 256 x 3

也就是1可以和任意维度兼容!

广播失败:

             axis:   0     1   2
a1      (3d array): 256 x 256 x 1
b      (2d array):       220 x 3
a1 + b  ValueError

失败转化

             axis:   0     1   2   3
a2      (4d array): 256 x 256 x 1 x 1
b      (2d array):           220 x 3
a2 + b  (4d array): 256 x 256 x 220 x 3

我们看到在a2的第三个维度增加了一个1,扩充为4维,便可以正常广播!

如何实现a1到a2转化?

a2 = a1[:,:,np.newaxis,:]即可!

9.常用函数

9.1 np.bincount()

首先生成一个一维数组

x = np.array([1, 2, 3, 3, 0, 1, 4])

统计索引出现次数:索引0出现1次,1出现2次,2出现1次,3出现2次,4出现1次

因此通过bincount计算出索引出现次数如下:

np.bincount(x)
# [1 2 1 2 1]

上面怎么得到的?

对于bincount计算吗,bin的数量比x中最大数多1,例如x最大为4,那么bin数量为5(index从0到4),也就会bincount输出的一维数组为5个数,bincount中的数又代表什么?代表的是它的索引值在x中出现的次数!

还是以上述x为例子,当我们设置weights参数时候,结果又是什么?

这里假定:

w = np.array([0.3,0.5,0.7,0.6,0.1,-0.9,1])

那么设置这个w权重后,结果为多少?

np.bincount(x,weights=w)

输出:

[ 0.1 -0.6  0.5  1.3  1. ]

怎么计算的?

先对x与w抽取出来:

x --->  [1, 2, 3, 3, 0, 1, 4]
w --->  [0.3,0.5,0.7,0.6,0.1,-0.9,1]

索引 0 出现在x中index=4位置,那么在w中访问index=4的位置即可,w[4]=0.1 索引 1 出现在x中index=0与index=5位置,那么在w中访问index=0与index=5的位置即可,然后将两这个加和,计算得:w[0]+w[5]=-0.6 其余的按照上面的方法即可!

bincount的另外一个参数为minlength,这个参数简单,可以这么理解,当所给的bin数量多于实际从x中得到的bin数量后,后面没有访问到的设置为0即可。

还是上述x为例:

这里我们直接设置minlength=7参数,并输出!

[1 2 1 2 1 0 0]

与上面相比多了两个0,这两个怎么会多?

上面知道,这个bin数量为5,index从0到4,那么当minlength为7的时候,也就是总长为7,index从0到6,多了后面两位,直接补位为0即可!

9.2 np.argmax()

函数原型为:numpy.argmax(a, axis=None, out=None).

函数表示返回沿轴axis最大值的索引。

x = [[1,3,3],
     [7,5,2]]
print(np.argmax(x))
# 3

对于这个例子我们知道,7最大,索引位置为3(这个索引按照递增顺序)!

axis属性

axis=0表示按列操作,也就是对比当前列,找出最大值的索引!

x = [[1,3,3],
     [7,5,2]]
print(np.argmax(x,axis=0))
# [1 1 0]

axis=1表示按行操作,也就是对比当前行,找出最大值的索引!

x = [[1,3,3],
     [7,5,2]]
print(np.argmax(x,axis=0))
# [1 0]

那如果碰到重复最大元素?

返回第一个最大值索引即可!

例如:

x = np.array([1, 3, 2, 3, 0, 1, 0])
print(x.argmax())
# 1

9.3 上述合并实例

这里来融合上述两个函数,举个例子:

x = np.array([1, 2, 3, 3, 0, 1, 4])
print(np.argmax(np.bincount(x)))

最终结果为1,为什么?

首先通过np.bincount(x)得到的结果是:[1 2 1 2 1],再根据最后的遇到重复最大值项,则返回第一个最大值的index即可!2的index为1,所以返回1。

9.4 求取精度

取指定位置的精度

In

np.around([-0.6,1.2798,2.357,9.67,13], decimals=0)

Out

看到没,负数进位取绝对值大的!

array([-1.,  1.,  2., 10., 13.])

In

np.around([1.2798,2.357,9.67,13], decimals=1)

Out

array([ 1.3,  2.4,  9.7, 13. ])

In

np.around([1.2798,2.357,9.67,13], decimals=2)

Out

array([ 1.28,  2.36,  9.67, 13.  ])

从上面可以看出,decimals表示指定保留有效数的位数,当超过5就会进位(此时包含5)!

但是,如果这个参数设置为负数,又表示什么?

In

np.around([1,2,5,6,56], decimals=-1)

Out

array([ 0,  0,  0, 10, 60])

发现没,当超过5时候(不包含5),才会进位!-1表示看一位数进位即可,那么如果改为-2呢,那就得看两位!

例如:

In

np.around([1,2,5,50,56,190], decimals=-2)

Out

array([  0,   0,   0,   0, 100, 200])

看到没,必须看两位,超过50才会进位,190的话,就看后面两位,后两位90超过50,进位,那么为200!

计算沿指定轴第N维的离散差值

In

x = np.arange(1 , 16).reshape((3 , 5))

Out

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15]])

In

np.diff(x,axis=1) #默认axis=1

Out

array([[1, 1, 1, 1],
       [1, 1, 1, 1],
       [1, 1, 1, 1]])

In

np.diff(x,axis=0) 

Out

array([[5, 5, 5, 5, 5],
       [5, 5, 5, 5, 5]])

取整

In

np.floor([-0.6,-1.4,-0.1,-1.8,0,1.4,1.7])

Out

array([-1., -2., -1., -2.,  0.,  1.,  1.])

看到没,负数取整,跟上述的around一样,是向左!

取上限

np.ceil([1.2,1.5,1.8,2.1,2.0,-0.5,-0.6,-0.3])

取上限!找这个小数的最大整数即可!

查找

利用np.where实现小于0的值用0填充吗,大于0的数不变!

In

x = np.array([[1, 0],
       [2, -2],
     [-2, 1]])

Out

array([[ 1,  0],
       [ 2, -2],
       [-2,  1]])

In

np.where(x>0,x,0)

Out

array([[1, 0],
       [2, 0],
       [0, 1]])
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-12-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光城 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Numpy实战全集
    • 0.导语
      • 1.Numpy基本操作
        • 1.1 列表转为矩阵
        • 1.2 维度
        • 1.3 行数和列数()
        • 1.4 元素个数
      • 2.Numpy创建array
        • 2.1 一维array创建
        • 2.1 多维array创建
        • 2.2 创建全零数组
        • 2.3 创建全一数据
        • 2.4 创建全空数组
        • 2.5 创建连续数组
        • 2.6 reshape操作
        • 2.7 创建连续型数据
        • 2.8 linspace的reshape操作
      • 3.Numpy基本运算
        • 3.1 一维矩阵运算
        • 3.2 多维矩阵运算
        • 3.3 基本计算
      • 4.Numpy索引与切片
        • 5.Numpy array合并
          • 5.1 数组合并
          • 5.2 数组转置为矩阵
          • 5.3 多个矩阵合并
          • 5.4 合并例子2
        • 6.Numpy array分割
          • 6.1 构造3行4列矩阵
          • 6.2 等量分割
          • 6.3 不等量分割
          • 6.4 其他的分割方式
        • 7.Numpy copy与 =
          • 7.1 =赋值方式会带有关联性
          • 7.2 copy()赋值方式没有关联性
        • 8.广播机制
          • 9.常用函数
            • 9.1 np.bincount()
            • 9.2 np.argmax()
            • 9.3 上述合并实例
            • 9.4 求取精度
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档