本节我们从demo.ipynb入手,一窥已经训练好的Mask-RCNN模型如何根据一张输入图片进行推断,得到相关信息,即inference模式的工作原理。
https://github.com/Hellcatzm/Mask_RCNN/blob/master/samples/demo.ipynb
首先进行配置设定,设定项都被集成进class config中了,自建新的设定只要基础改class并更新属性即可,在demo中我们直接使用COCO的预训练模型所以使用其设置即可,但由于我们想检测单张图片,所以需要更新几个相关数目设定:
首先初始化模型,然后载入预训练参数文件,在末尾我可视化了模型,不过真的太长了,所以注释掉了。在第一步初始化时就会根据mode参数的具体值建立计算图,本节介绍的推断网络就是在mode参数设定为"inference"时建立的计算网络。
读取一张图片,调用model的detect方法,即可输出结果,最后使用辅助方法可视化结果:
inference的前向逻辑如下图所示,我们简单的看一下其计算流程是怎样的,
具体每种张量的意义我们会在源码分析中一一介绍。
深度学习视频资源,由浅入深讲解,通俗易懂。