基于深度学习全卷积网络的视觉影像语义分割软件

FCN网络说明

该网络为中国地质大学(武汉)信息工程学院关庆锋教授团队基于ADE_20K数据集训练的深度学习全卷积网络,软件编写语言为C++。

该程序由高性能计算实验室(CUG.HPSCIL)实验室提供,版权为CUG.HPSCIL实验室所有。

开放软件下载是为了方便各位老师和同学开展计算机视觉或城市计算相关的研究,请勿用做商业用途。

ADE_20K训练和测试数据集介绍和下载:http://groups.csail.mit.edu/vision/datasets/ADE20K/

该网络在训练数据集的像素对比精度:0.814426,在测试数据集的像素对比精度:0.66839。

有问题请在本文下方留言。

【图片1】 生活场景照片分割

【图片2】 街景照片分割(叠加效果)

下载地址

软件名称:GPU-CUDA-enabled Semantic Segmentation App. v1.0

链接:https://pan.baidu.com/s/1-wdkcp9St44NQefzwCXHxg

密码:slap

链接有效期:2018.5.16 - 2018.5.23

软件运行环境(必须):

Windows 8/10 (64位)

Microsoft Visual C++ 2015/2017 Redistributable

NVDIA CUDA 9.x

已在Win 10 (64位) & GTX 1050 / GTX 1080ti 测试通过,软件支持多显卡工作站和服务器。

软件使用说明

软件支持将照片进行语义分割(支持识别150种物体,类别ID请查看“输出数据说明”),下载后解压到全英文路径。

软件为控制台程序。鼠标右键点击run.bat文件,使用Windows记事本或Notepad++打开run.bat,修改输入参数:图像文件夹路径和输出特征文件路径(如图3)。

保存run.bat文件,并关闭。

鼠标左键双击run.bat即可运行。

软件参数说明

文件夹内DNN文件为我们训练好的FCN卷积网络文件,请勿移动或更名。

BAT文件内参数如下所示:

【图片3】第15行为修改位置

修改方法:

./SemanticSegmentation.exe 输入DNN文件名(不用修改) 输入图像文件夹位置 输出地物百分比特征位置

输出数据说明

输出数据为16位的分割PNG图像文件,命名规则为“输入图像文件名_seg.png”,存储于输入文件夹的"seg_files"文件夹内。

输出的分割PNG图像文件内每一个ID对应一类物体,类别ID在objectInfo150.txt文件中查询,0表示未知地物。

输出的特征CSV文件为每张图像中150类地物所占比例。

注意事项

该程序为Windows控制台程序,需要vs2015以上的运行环境支持。

如果没有安装2015以上版本Visual Studio,请在这里下载VC运行库:https://www.microsoft.com/en-us/download/details.aspx?id=48145。

请保证程序目的和执行都在全英文路径环境下,包括输入参数和图像路径。

如果能启动后可识别图像文件,但处理失败的话,文件夹路径改为绝对路径。

每张图像不要超过1000*1000大小。文件如果过大可能会超出本地计算机/工作站的GPU内存承载能力,导致内存溢出错误。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180516G1792B00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券

年度创作总结 领取年终奖励