(以下用“MTCNN”代指这个算法)本文以Q&A的方式,与你分享一些经验和思考。先列出本文会回答的问题列表:
MTCNN的推断流程第一阶段:1.1 为什么需要对图片做“金字塔”变换?...反过来,就可以把S的得分信息,还原成输入图片的各区域有无人脸,伪代码是: 令: (x1, y1),(x2, y2)分别是输入矩阵中一个矩形区域的左上角和右下角坐标 (x, y, s)中(x,y)是得分矩阵上任意一点坐标...类似于前文1.5的过程,一个输入矩阵A,P-NET还能得到4个二维矩阵dx1, dy1, dx2, dy2,每个的尺寸与上述S一样,分布代表人脸区域的左上角和右下角坐标的”相对值”。...MTCNN的映射关系与上文的这种有一点点区别,下面展示如何从P-NET得到的边框坐标,修正原图上的边框坐标的算法: 令 (x1, y1),(x2, y2)分别是输入矩阵中一个矩形区域的左上角和右下角坐标...这个部分因为机器性能、参数设置、输入图片尺寸,都对实际的计算效率有很大影响,仅提示一些关键点。 3.1 三个阶段的时间占比如何?
3.2 有什么优化方案?