【今日知图】
段落移动
{ 上一段
} 下一段
0.月总结1.访问数组2.broadcast机制3.np.bincount()4.np.argmax()5.联合求解6.作者的话
从读研开始,这是第三个月开始,已经过去两个月了,今天来总结一些研一10月到11月的常规学习。
相比于上个月,在知识图谱方面深入研究了apoc导入及整个neo4j的可视化流程,对于Python爬虫从基础文深入到反爬文章,并利用python技术解决日常生活遇到的问题,学以致用,对于机器学习,相比上个月读书略有减少,对于图像及深度学习等相关内容,仍在学习中,对于知乎爬虫已经接近尾声,完全的数据抽取及可视化存储等技术的应用将于下一个月开展,对于未来的深度学习将会有更深层次的挖掘,对于爬虫则会有更深入的研究,同时对于基础会着重反复,对于leetcode刷题,每周两道,从不懈怠,每周坚持,现已坚持18篇,9周!
对于本月文章的总结,本月公众号发文,保证了每日一篇,30篇,从无缺席,并且全部原创,0广告,对于公众号的交流群从0人次到110+人次,目前交流氛围很好,有待继续保持!
下面一起来,深入研究今日文章的干文,在日常学习当中所碰到的numpy深度函数~~~
普通访问
import numpy as np
a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(a)
# 获取第3列所有数据
print(a[:,2])
输出:
[[ 1 2 3 4]
[ 5 6 7 8]
[ 9 10 11 12]]
[ 3 7 11]
整型数组访问
整型数组访问允许我们利用其它数组的数据构建一个新的数组,还是以上述的二维数组为例:
print(a[[0, 1, 2], [0, 1, 0]])
输出:
[1 6 9]
怎么得到的?
上述等价于
np.array生成一维度数组,一维数组的元素通过上述的普通法访问得到。
print(np.array([a[0, 0], a[1, 1], a[2, 0]]))
也就是说,上述a中为一个二维数组,实际上前后对应关系,然后按照普通访问方式获取即可!
除此之外,整型数组访问可以用来选择或者更改矩阵中每行中的一个元素!
仍然是以上述的二维数组为例:
b = np.array([0, 2, 1])
print(a[np.arange(3),b])
这个又该得到什么结果?
[ 1 7 10]
为什么?
np.arrange(3)
得到0,1,2个数,每次取出其中一个元素进行访问,上述便转换为a[0,0],a[1,2],a[2,1] 分别为1 7 9 10,也就是上述输出的结果!
布尔型数组访问
布尔型数组访问可以选择数组中任意元素。
这种访问方式用于选取数组中满足某些条件的元素。
还是以上述二维数组为例:
我们筛选所有大于3的数,并输出。
bool_index = (a > 3)
print(bool_index)
print(a[bool_index])
print(a[a>3])
输出:
[[False False False True]
[ True True True True]
[ True True True True]]
[ 4 5 6 7 8 9 10 11 12]
[ 4 5 6 7 8 9 10 11 12]
numpy数组间的基础运算是一对一,也就是a.shape==b.shape,但是当两者不一样的时候,就会自动触发广播机制,如下例子:
from numpy import array
a = array([[ 0, 0, 0],
[10,10,10],
[20,20,20],
[30,30,30]])
b = array([0,1,2])
print(a+b)
输出:
[[ 0 1 2]
[10 11 12]
[20 21 22]
[30 31 32]]
为什么是这个样子?
这里以tile
模拟上述操作,来回到a.shape==b.shape情况!
# 对[0,1,2]行重复3次,列重复1次
b = np.tile([0,1,2],(4,1))
print(a+b)
输出:
[[ 0 1 2]
[10 11 12]
[20 21 22]
[30 31 32]]
到这里,我们来给出一张图:
是不是任何情况都可以呢?
当然不是,只有当两个数组的trailing dimensions compatible时才会触发广播,否则报错ValueError: frames are not aligned exception
。
上面表达意思是尾部维度必须兼容!
尾部维度:
将多维数组右对齐!能够上下对应,这部分就是尾部,而对应的头部维度,则是维度大的数组比维度小的数组多出来的维度!如下面实际例子:
axis: 0 1 2
a (3d array): 256 x 256 x 3
b (2d array): 256 x 3
a + b (2d array): 256 x 256 x 3
兼容
they are equal, or one of them is 1
兼容两层意思,深入研究,第一:they are equal
尾部维度相等!
axis: 0 1 2
a (3d array): 256 x 256 x 3
b (2d array): 256 x 3
a + b (2d array): 256 x 256 x 3
第二:one of them is 1
像下面这个尾部维度不等,但是a或者b对应的元素有1存在,那么也满足兼容性!
axis: 0 1 2
a (3d array): 256 x 256 x 1
b (2d array): 1 x 3
a + b (2d array): 256 x 256 x 3
也就是1可以和任意维度兼容!
广播失败:
axis: 0 1 2
a1 (3d array): 256 x 256 x 1
b (2d array): 220 x 3
a1 + b ValueError
失败转化
axis: 0 1 2 3
a2 (4d array): 256 x 256 x 1 x 1
b (2d array): 220 x 3
a2 + b (4d array): 256 x 256 x 220 x 3
我们看到在a2的第三个维度增加了一个1,扩充为4维,便可以正常广播!
如何实现a1到a2转化?
a2 = a1[:,:,np.newaxis,:]
即可!
首先生成一个一维数组
x = np.array([1, 2, 3, 3, 0, 1, 4])
统计索引出现次数:索引0出现1次,1出现2次,2出现1次,3出现2次,4出现1次
因此通过bincount计算出索引出现次数如下:
np.bincount(x)
# [1 2 1 2 1]
上面怎么得到的?
对于bincount计算吗,bin的数量比x中最大数多1,例如x最大为4,那么bin数量为5(index从0到4),也就会bincount输出的一维数组为5个数,bincount中的数又代表什么?代表的是它的索引值在x中出现的次数!
还是以上述x为例子,当我们设置weights参数时候,结果又是什么?
这里假定:
w = np.array([0.3,0.5,0.7,0.6,0.1,-0.9,1])
那么设置这个w权重后,结果为多少?
np.bincount(x,weights=w)
输出:
[ 0.1 -0.6 0.5 1.3 1. ]
怎么计算的?
先对x与w抽取出来:
x ---> [1, 2, 3, 3, 0, 1, 4]
w ---> [0.3,0.5,0.7,0.6,0.1,-0.9,1]
索引 0 出现在x中index=4位置,那么在w中访问index=4的位置即可,w[4]=0.1 索引 1 出现在x中index=0与index=5位置,那么在w中访问index=0与index=5的位置即可,然后将两这个加和,计算得:w[0]+w[5]=-0.6 其余的按照上面的方法即可!
bincount的另外一个参数为minlength,这个参数简单,可以这么理解,当所给的bin数量多于实际从x中得到的bin数量后,后面没有访问到的设置为0即可。
还是上述x为例:
这里我们直接设置minlength=7参数,并输出!
[1 2 1 2 1 0 0]
与上面相比多了两个0,这两个怎么会多?
上面知道,这个bin数量为5,index从0到4,那么当minlength为7的时候,也就是总长为7,index从0到6,多了后面两位,直接补位为0即可!
函数原型为:numpy.argmax(a, axis=None, out=None)
.
函数表示返回沿轴axis最大值的索引。
x = [[1,3,3],
[7,5,2]]
print(np.argmax(x))
# 3
对于这个例子我们知道,7最大,索引位置为3(这个索引按照递增顺序)!
axis属性
axis=0表示按列操作,也就是对比当前列,找出最大值的索引!
x = [[1,3,3],
[7,5,2]]
print(np.argmax(x,axis=0))
# [1 1 0]
axis=1表示按行操作,也就是对比当前行,找出最大值的索引!
x = [[1,3,3],
[7,5,2]]
print(np.argmax(x,axis=0))
# [1 0]
那如果碰到重复最大元素?
返回第一个最大值索引即可!
例如:
x = np.array([1, 3, 2, 3, 0, 1, 0])
print(x.argmax())
# 1
这里来融合上述两个函数,举个例子:
x = np.array([1, 2, 3, 3, 0, 1, 4])
print(np.argmax(np.bincount(x)))
最终结果为1,为什么?
首先通过np.bincount(x)得到的结果是:[1 2 1 2 1],再根据最后的遇到重复最大值项,则返回第一个最大值的index即可!2的index为1,所以返回1。