NumPy(Numerical Python)是 Python 中的一个线性代数库。对每一个数据科学或机器学习 Python 包而言,这都是一个非常重要的库,SciPy(Scientific Python)、Mat-plotlib(plotting library)、Scikit-learn 等都在一定程度上依赖 NumPy。
对数组执行数学运算和逻辑运算时,NumPy 是非常有用的。在用 Python 对 n 维数组和矩阵进行运算时,NumPy 提供了大量有用特征。
这篇教程介绍了数据科学初学者需要了解的 NumPy 基础知识,包括如何创建 NumPy 数组、如何使用 NumPy 中的广播机制、如何获取值以及如何操作数组。更重要的是,大家可以通过本文了解到 NumPy 在 Python 列表中的优势:更简洁、更快速地读写项、更方便、更高效。
import numpy as np
a = np.array([1,2,3]) # 创建数组,传入的是列表参数
b = np.arange(0, 10, 1) # 相当于python 的range
a = np.linspace(0,10,10#个数) #0到9
b = np.logsoace(0,10,10 #可以用base=2改变底数) # 10^0 和 10^10
a = np.array([[1,2,3],[4,5,6]])
a.reshape(1,-1)
a.reshape(-1,1)
a
array([[1, 2, 3, 4, 5, 6]])
array([[1],
[2],
[3],
[4],
[5],
[6]])
array([[1, 2, 3],
[4, 5, 6]])
axis=1实际上是说,只对行进行操作 axis=1实际上是说,只对列进行操作
a = np.array([1,2,1,1,1,3,4,3,5,2,3])
np.unique(a) # array([1, 2, 3, 4, 5])
np.random.rand(3,4) # rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
np.random.randn(3,4) # randn函数返回均值=0,标准差=1,具有标准正态分布。
np.random.normal(5,1,size=(3, 4)) #normal函数是正态分布,但可以修改均值和标准差,第一个是均值,第二个是标准差,还可以传入size
np.random.randint(1, 10, 10) #返回随机整数,范围区间为[low,high),包含low,不包含high
np.random.choice(3,3) #从给定的0到3中生成3个随机数,还可以传入size为数组维度
array([[0.38791074, 0.66974604, 0.93553907, 0.84631092],
[0.31327352, 0.52454816, 0.44345289, 0.22957721],
[0.53441391, 0.91396202, 0.45720481, 0.43069857]])
array([[ 0.8858294 , 0.63190187, 0.04026035, -0.90312288],
[ 0.17532267, 0.19443089, -0.53524902, 0.77735121],
[ 0.17133845, -0.44285144, 1.70490377, 0.92434585]])
array([[3.69513876, 4.61942496, 4.25637299, 4.56287823],
[4.57354991, 6.3814073 , 5.09837051, 4.63054252],
[3.72678005, 6.0149868 , 3.51894029, 4.71290011]])
array([9, 7, 4, 8, 8, 5, 6, 4, 7, 9])
array([0, 2, 2])
import numpy as np
for i in range(5):
np.random.seed(1) # 当这里有数时,生成相同的随机数
a = np.random.randint(1,10,10)
print(a)
[6 9 6 1 1 2 8 7 3 5]
[6 9 6 1 1 2 8 7 3 5]
[6 9 6 1 1 2 8 7 3 5]
[6 9 6 1 1 2 8 7 3 5]
[6 9 6 1 1 2 8 7 3 5]
矩阵matrix和数组array是NumPy里的两种数据类型。matrix是array的分支,matrix和array在很多时候都是通用的,你用哪一个都一样。Numpy matrices必须是2维的,但是 numpy arrays (ndarrays) 可以是多维的
![import numpy as np
np.matrix(np.eye(4))
np.array(np.eye(4)]
matrix.T transpose:返回矩阵的转置矩阵 (数组都有) 这是只有矩阵才有的 matrix.H hermitian (conjugate) transpose:返回复数矩阵的共轭元素矩阵 matrix.I inverse:返回矩阵的逆矩阵 matrix.A base array:返回矩阵基于的数组
a = np.matrix('1 2 7; 3 4 8; 5 6 9')
例子
a = np.random.randn(3,4)
a.T
a.I
a = np.mat(a)
a.I
array([[ 0.52226072, 1.77935565, -0.76208424],
[ 1.58157201, -1.18125853, 0.77364867],
[ 1.19925864, 1.03371571, 1.11650254],
[-0.31157359, 2.07659653, -0.3801554 ]]) #这是第一个a.T的结果
AttributeError: 'numpy.ndarray' object has no attribute 'I' #a.I会报错,因为数组没有这个参数
matrix([[ 0.48687424, 0.06555841, -0.68032801], #a = np.mat(a)将数组变成矩阵,所以这时a.i才有输出
[ 0.47857106, -0.14676465, -0.23285881],
[-0.04159389, 0.22476055, 0.63790475],
[-0.12424659, 0.23001231, 0.13294199]])
a = np.arange(6).reshape(2,3)
b = np.arange(6,12) .reshape(2,3)
a1 = np.concatenate([a,b]) #默认axis=0 相当于vstack
a2 = np.concatenate([a,b],axis=1) #相当于hstack
array([[ 0, 1, 2],
[ 3, 4, 5],
[ 6, 7, 8],
[ 9, 10, 11]])
array([[ 0, 1, 2, 6, 7, 8],
[ 3, 4, 5, 9, 10, 11]])
a,b,c,d=np.split(a1,[ 1,2,3 ] # 就是切片 ) 默认axis=0 # 以此类推
a,b,c = np.split(a2,[2,4],axis = 1)
只打印第一个a
a = array([[0, 1, 2]])
a = array([[0, 1],
[3, 4]])
a = np.arange(0,3000,5)
a[(a>1000)&(a<2000)] = 0 a[~((a>1000)&(a<2000))] = 1
a = np.random.rand(10,10)
a[(a<0)] = 0
a.mean(0)