【GiantPandaCV导语】以卷积和im2col+gemm实现卷积操作举例,来图解深度学习中Tensor的NC4HW4(其实应该是N{C/4+C%4>0?1:0}HW4),写成NC4HW4方便阅读.
卷积操作示意图
NCHW的Tensor内存排布示意图
卷积实现示意图
想使用指令集加速卷积,不能直接计算
经过NC4HW4重排后的Tensor在内存中的排布示意图
使用指令集加速卷积,可以直接计算
卷积示意图
Im2Col图解
卷积示意图
NCHW转NC4HW4
NC4HW4对feature进行im2col示意图
NC4HW4对kernel进行im2col
使用SSE,Neon,OpenCL或OpenGL实现Gemm