前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Opencv+TF-Slim实现图像分类及深度特征提取

Opencv+TF-Slim实现图像分类及深度特征提取

作者头像
OpenCV学堂
发布2019-08-19 10:38:13
1.3K1
发布2019-08-19 10:38:13
举报

点击上方↑↑↑“OpenCV学堂”关注我

投稿作者:小黄弟, 来自:中国电科智慧城市建模仿真与智能技术重点实验室 文字编辑:gloomyfish 如果你觉得文章对你有帮助,欢迎转发支持

tf-slim

TF-Slim是一个用于定义、训练和评估复杂模型的tensorflow轻量级库,在slim库中已经有很多官方实现的网络并用ImageNet进行了预训练,如VGG、ResNet、Inception等,可直接拿来使用。本文将用Opencv的dnn模块调用预训练的InceptionV4模型进行图像分类及深度特征的提取。

首先需要下载tensorflow的model模块,地址为

https://github.com/tensorflow/models/slim位于 \models-master\research\slim路径下在https://github.com/tensorflow/models/tree/master/research/slim

下载预训练的分类模型,如图

下载InceptionV4的Checkpoint文件,格式为ckpt,Opencv只能调用冻结好的pb文件,所以需要将ckpt文件转为pb文件。在slim下新建文件夹为checkpoint,并将下载的inception_v4.ckpt放于该文件夹下。用slim下的export_inference_graph.py文件导出InceptionV4的图,大小为1M左右的my_inception_v4.pb。再通过tensorflow的freeze_graph.py文件导出冻结的InceptionV4文件,大小为160M左右的inception_v4_freeze.pb。此文件用于被Opencv调用。

基于InceptionV4实现图像分类

无废话版本,OpenCV DNN模块支持导入Inception v4模型,实现图像分类,代码演示如下:

Mat img, proBlob, prob;
Pointclass_number;
doubleclassProb;
intclass_id, class_id1;
img=imread("cat.jpg");

Netnet = readNetFromTensorflow("inception_v4_freeze.pb");
//net.setPreferableBackend(DNN_BACKEND_OPENCV);       //启动GPU加速
//net.setPreferableTarget(DNN_TARGET_OPENCL);         //启动GPU加速
if (net.empty())
{
    cout<<"model file is not found"<<endl;
    return -1;
}
proBlob=blobFromImage(img, 1/255.0, Size(299, 299), Scalar(0, 0, 0), true, false); 
net.setInput(proBlob, "input");
prob=net.forward("InceptionV4/Logits/Predictions");
MatproMax = prob.reshape(1, 1);
minMaxLoc(proMax, NULL, &classProb, NULL, &class_number);
class_id = class_number.x;  //获得预测索引
cout<<"class_id:"<<class_id<<endl;

运行输出结果为:

在classification_classes_ILSVRC2012.txt中对应的类别为Siamese cat, Siamese.

基于InceptionV4实现特征提取

图像分类模型最后逻辑层是输出分类得分,最后一个卷积层/池化层输出的结果为图像特征数据,通过在推断时候指定该层名称就可以实现在OpenCV DNN中通过CNN网络实现图像特征提取,对Inception V4模型来说,在forward时候把图像分类输出层

"InceptionV4/Logits/Predictions"

改为

"InceptionV4/Logits/AvgPool_1a/AvgPool"

即可得到图像特征,代码演示如下:

Mat img, proBlob, prob;
Pointclass_number;
doubleclassProb;
intclass_id, class_id1;
img=imread("cat.jpg");

Netnet = readNetFromTensorflow("inception_v4_freeze.pb");
//net.setPreferableBackend(DNN_BACKEND_OPENCV);       //启动GPU加速
//net.setPreferableTarget(DNN_TARGET_OPENCL);         //启动GPU加速
if (net.empty())
{
cout<<"model file is not found"<<endl;
return -1;
}
proBlob=blobFromImage(img, 1/255.0, Size(299, 299), Scalar(0, 0, 0), true, false); 
net.setInput(proBlob, "input");
prob=net.forward("InceptionV4/Logits/AvgPool_1a/AvgPool");
prob=prob.reshape(1, 1);
cout<<"prob.size():"<<prob.size()<<endl;
cout<<prob<<endl;

此时的prob即为深度特征,得到图像特征描述数据如下:

相应代码文件已上传至网盘:

https://pan.baidu.com/s/1Alb9y6T0bT1iOWVA11eATA
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-08-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 OpenCV学堂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档