caffe随记(九)---利用FCN和已有的model进行图像语义分割

1、下载caffemodel

本例中我们使用的是pascalcontext-fcn32的模型,这个下载链接在它的文件夹里有,就是url那个文件

下载  pascalcontext-fcn32s-heavy.caffemodel 这个文件

2、增加python的路径

本次我使用的方法是 vim ~/.bashrc

在最后一行添加python路径,如下图,请根据自己的路径修改路径

3、创建deploy.prototxt

因为32s文件夹中是没有这个deploy.prototxt文件的。而我们一会儿要用到,所以我们可以根据train或者val来稍加修改即可。

比如把train.prototxt的data layer进行修改

我把我的变形金刚输入法一不小心截图截上了…………

直接 cp ./train.prototxt  ./deploy.prototxt

然后 vim deploy.prototxt进行修改,如下所示:

更改之后的数据层如我上面的截图所示

4、修改infer.py

其实我们主要就是用这个infer.py文件进行分割的,为了避免我把原始的infer.py改动,我就复制了一个到fcn32s这个文件夹中,这样无论我怎么改都不会破坏原始的文件 了

我们先来看看原始的文件的内容:

import numpy as np
from PIL import Image

import caffe

# load image, switch to BGR, subtract mean, and make dims C x H x W for Caffe
im = Image.open('pascal/VOC2010/JPEGImages/2007_000129.jpg')  //这个就是我们输入文件的路径,一会儿应该进行修改
in_ = np.array(im, dtype=np.float32)
in_ = in_[:,:,::-1]
in_ -= np.array((104.00698793,116.66876762,122.67891434))
in_ = in_.transpose((2,0,1))

# load net
net = caffe.Net('voc-fcn8s/deploy.prototxt', 'voc-fcn8s/fcn8s-heavy-pascal.caffemodel', caffe.TEST) //这里是我们需要用到的网络模型和caffemodel,也要改
# shape for input (data blob is N x C x H x W), set data
net.blobs['data'].reshape(1, *in_.shape)
net.blobs['data'].data[...] = in_
# run net and take argmax for prediction
net.forward()
out = net.blobs['score'].data[0].argmax(axis=0)

所以对我上面注释的两个地方进行修改:

要注意我是把infer.py复制了一个到fcn32s文件夹中的,所以你们的路径要根据自己的路径来设置合适。

而且我也把待分割图片放入了fcn32s文件夹中了。

修改之后如下所示:

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt   //加了一行这个
import caffe

# load image, switch to BGR, subtract mean, and make dims C x H x W for Caffe
im = Image.open('71.jpg')        //我已经把一个名为71.jpg的图像文件放进了我的当前fcn32s的目录下
in_ = np.array(im, dtype=np.float32)
in_ = in_[:,:,::-1]
in_ -= np.array((104.00698793,116.66876762,122.67891434))
in_ = in_.transpose((2,0,1))

# load net
net = caffe.Net('./deploy.prototxt', './pascalcontext-fcn32s-heavy.caffemodel', caffe.TEST)  //然后也是把deploy和caffemodel准备好了
# shape for input (data blob is N x C x H x W), set data
net.blobs['data'].reshape(1, *in_.shape)
net.blobs['data'].data[...] = in_
# run net and take argmax for prediction
net.forward()
out = net.blobs['score'].data[0].argmax(axis=0)
plt.imshow(out,cmap='gray') //这三行都是我新加的,是处理分割后的图片
plt.axis('off')             //
plt.savefig('test.png')     //图片存为test.png 于当前目录下

5、进行分割

直接在当前目录下 输入命令: python infer.py 

然后发现报错了……错误如下所示:

QXcbConnection: Could not connect to display

然后搜了很久发现这个网页的办法成功解决了我们的问题:

https://www.douban.com/note/612063589/

也就是把最前面的几行做一下修改,结合我们的工程,我的修改如下:

import numpy as np
from PIL import Image
import matplotlib     //就是增加了这两行
matplotlib.use('Agg') //就是增加了这两行
import matplotlib.pyplot as plt
import caffe

然后就可以正常执行了,因为我连的是服务器,是纯命令行界面,不能弹出生成图片的对话框,但是可以保存图片以供查看,算是解决问题了

执行 python infer.py

最后得出一个 test.png

6、把图片copy到我的电脑上:

scp  Teeyo@192.168.0.106:~/caffe/models/fcn.berkeleyvision.org/pascalcontext-fcn32s/test.png  ./博文

再输个服务器密码就copy过来了,详细用法请百度linux语言 scp

结果如图所示,虽然我还没有想通该怎么涂上彩色,但是好歹FCN进行语义分割咱们是走了一趟了

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能LeadAI

配置深度学习主机与环境(TensorFlow+1080Ti) | 第四章 基于Anaconda的TensorFlow安装

配置深度学习主机与环境(TensorFlow+1080Ti): 01 概念介绍 Anaconda Anaconda(https://www.continuu...

3725
来自专栏生信技能树

R包终极解决方案

写在前面: 在如何通过Google来使用ggplot2可视化这篇文章中,我们曾经介绍过R语言在生物信息学中的重要性。 这篇文章也激发了很多小伙伴学习的热情。学习...

3507
来自专栏AI研习社

在 Mac OS X 装不上 TensorFlow?看了这篇就会装

这个文档说明了如何在 Mac OS X 上安装 TensorFlow。(从 1.2 版本开始,在 Mac OS X 上 TensorFlow 不再支持 GPU。...

4266
来自专栏潇涧技术专栏

Develop with OpenCV on Mac

本文介绍如何在Mac OS X上进行OpenCV项目的开发,尝试的开发工具有Xcode(版本是4.6.1)和Eclipse,使用的OpenCV版本是2.4.6。

892
来自专栏腾讯云API

PyQt5开发入门(PyQt5安装与Pycharm配置)

为了给大家更多灵感,我录制了一套云API构建自己翻译系统的视频。在视频中,涉及到了GUI相关的内容,所以在这里给大家写了一个pyqt5开发和配置的一个简单的小流...

1819
来自专栏深度学习计算机视觉

Qt+opencv+EasyPR(车牌识别系统,从配置环境到成功运行)

最近在东软睿道实训搞一个车牌识别系统,所用材料为Qt+opencv+EasyPR,从配环境到成功运行历时几天颇为艰难,这里写篇经验贴,手把手教你~ 作者:张俊怡...

3943
来自专栏菩提树下的杨过

silverlight:DeepZoom版的图片局部放大效果

先上演示地址: http://images.24city.com/jimmy/DeepZoom/ 步骤: 1.先启动PhotoShop,利用自动等分切片功能把...

1868
来自专栏计算机视觉life

OpenCV学习入门(二):Image Watch神器

Image Watch是在visual studio 2012及以上版本上使用的一款OpenCV工具,能够在调试过程中实时显示内存中矩阵Mat(存放图像,数组等...

1855
来自专栏Small Code

XGBoost 在 Windows 10 和 Ubuntu 上的安装

关于什么是 XGBoost,我在这里不再解释,如果有时间的话再写一篇文章来解释,在数据科学里非常有用。大家可以参考 Tianqi Chen 的论文 XGBoos...

3577
来自专栏存储

建立本地的Blast数据库

Blast(basic local alignment search tool) 局部序列比对基本检索工具,是NCBI开发的一款基于序列相似性的数据库搜索程序。...

2979

扫码关注云+社区