前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >又一神器面世:百度重磅发布「全流程开发套件」!

又一神器面世:百度重磅发布「全流程开发套件」!

作者头像
GitHubDaily
发布2020-11-05 15:03:59
5800
发布2020-11-05 15:03:59
举报
文章被收录于专栏:GitHubDaily

最近在做一个工业巡检的项目,主要涉及的内容是指针型表计的读取。本系列文章主要介绍实现表计读取的全流程开发。其中主要使用的工具为飞桨全流程开发工具 PaddleX 和 Visual Studio 2019。

工业质检和工业巡检是深度学习技术在工业领域应用比较广泛的两个场景,而其实现流程是类似的,可以由图 1 大致展示:

图 1 工业质检及巡检实现流程

本系列文章的内容包含了上述流程的全部内容,主要内容如下:

  • 高效语义分割:基于 PaddleX 图形化开发界面(Demo),零代码快速实现表计分割
  • 工业场景适配:Windows 下 PaddleX 的 C++ 编译并生成 dll
  • 表计读取实战:基于 C# 的识别界面开发和 dll 文件调用

正文开始前再说一句,各位兄弟姐妹快去 GitHub 给 PaddleX 点 star 啊。点 star,不白嫖!链接如下:

https://github.com/PaddlePaddle/PaddleX

高效语义分割:基于 PaddleX

零代码快速实现表计分割

PaddleX 是什么?

在 PaddleX 的官网上有其详细的介绍,我这里把它们摘录出来:

PaddleX 是基于飞桨开发的一款全流程开发套件,以低代码、甚至零代码的形式支持开发者快速实现产业实际项目落地。

PaddleX 中集成了飞桨智能视觉领域图像分类、目标检测、语义分割、实例分割任务能力,将深度学习开发全流程从数据准备、模型训练与优化到多端部署端到端打通,并提供统一任务 API 接口及图形化开发界面(Demo)。开发者无需分别安装不同套件,以低代码的形式即可快速完成飞桨全流程开发。

PaddleX 经过质检、安防、巡检、遥感、零售、医疗等十多个行业实际应用场景验证,沉淀产业实际经验,并提供丰富的案例实践教程,全程助力开发者产业实践落地。

一句话概括优势:极大降低开发成本、缩短开发周期、降低开发难度。

工业党们最在意的效率和成本,PaddleX 都解决了。PaddleX 提供了两种开发模型:Python 函数库开发模式和 PaddleX 图形化开发模式。

(1)Python 函数库模式:这种模式与我们平时比较熟悉的深度学习开发模式差不多,不过 PaddleX 提供了众多简洁、全面、集成度较高的 API,这使得我们仅仅需要非常少量的的代码量,就可以实现图像分类、检测、分割等任务,并快速进行模型部署。

(2)“丧心病狂” 的图形化开发模式:当我第一次看到 PaddleX 图形化开发界面的时候,我就知道,调参党的日子要不好过了,以及工业党的福利来了。之所以这么说,是因为使用 PaddleX 图形化开发界面,零代码就可以实现数据准备、模型训练、模型调优、模型部署全流程的开发。并且,这款工具竟然是免费的。如图 2 所示,它将深度学习开发中的调参转化为点选式的选择,无需代码就可以便捷、高效地调整模型类型、backbone、模型参数和训练参数。相信经过做项目验证、做方案的工业党们都明白这意味着什么。从我的经验来看,使用 PaddleX 图形化开发界面,能够改进低效流程,将项目验证的效率提升 10 倍以上,极大缩短开发周期。

如果大家希望自己开发一个企业或者行业专用版本的图形化开发界面,PaddleX 也是个很好的参照。

图 2 PaddleX 图形化开发界面

如何使用 PaddleX 实现

压力表的语义分割

废话不多说,下面将以压力表的语义分割为例,边介绍边实战。飞桨提供了官方使用教程文档,链接为:

https://paddlex.readthedocs.io/zh_CN/develop/gui/how_to_use.html

与命令行模式的深度学习开发类似,使用 PaddleX 图形化开发界面完成压力表的语义分割也需要按照如图 3 所示的流程进行。

图 3 使用 PaddleX 图形化开发界面实现语义分割流程示意图

(1)数据准备

如图 4 所示,在安装完 PaddleX 图形化开发界面之后,打开软件。首先选择数据集管理;然后点击新建数据集,创建语义分割数据集。

图 4 创建数据集

点击创建数据集后,如图 5 所示,首先按照数据集导入规则,将原始图像和标注图像分别放在 JPEGImages 和 Annotations 文件夹中;然后选择数据集路径,确认导入。这里需要注意一下,labelme 标注出的分割标注格式为 json 文件,需要首先转换为 label.png 文件(要注意自己的标注是一个标签还是多标签)。正如图 6 中展示的那样,导入后,将数据集切分为训练集、验证集和测试集。一般按照默认比例即可。

图 5 数据导入

图 6 数据切分

( 2)创建项目

进行模型训练点击我的项目,新建语义分割项目后,进入到项目开发界面。

数据选择:如图 7 所示,选择数据准备中创建的压力表数据集。

图 7 数据选择

参数配置:如图 8 所示,在参数配置中,大家可以根据自己的需求来配置。我所使用的模型为 DeepLabv3 + 该模型在语义分割有更好的效果。backbone 选择 MobileNetV2_x0.5。迭代轮数为 200,学习率 0.005,batch size 为 1(为控制训练中的振荡幅度,学习率和 batch size 要相匹配的调整,减小 batch size 一般需等倍数减小学习率)。

图 8 模型及训练参数配置

训练过程中的模型可视化:如图 9 及图 10 所示,通过 PaddleX 界面查看看到当前的训练轮数,训练集损失值和验证集的各项参数。除此之外,PaddleX 中集成了 Visual DL,可以查看模型训练过程参数变化、日志详情,及当前最优的训练集和验证集训练指标。

图 9 模型训练可视化

图 10 VisualDL 训练可视化

模型裁剪:训练结束后,可选择进入模型裁剪,也可直接进行模型评估。

(3)模型评估

参数评估:如图 11 所示,在模型评估页面,可查看训练后的模型效果。评估方法包括混淆矩阵、精度、召回率等。

图 11 模型评估

分割测试:如图 12 所示,可以更加直观地进行测试集图片测试,或者单张图片测试,来评估模型的性能。并可将训练后的模型保存为预训练模型。

图 12 模型测试

我们来看一下使用 PaddleX 训练后,压力表分割的效果如图 13 所示:

图 13 压力表分割效果

放大之后:

图 14 压力表分割放大

本次训练仅使用了 60 多张压力表的图像数据,数据量比较小。但是可以看出,最终实现的分割效果还是相当不错的。

(4)模型发布

在得到一个性能较好的模型后,我们最终的目的是将模型部署至服务器端或者移动端。在做工业质检或巡检时,我们一般都部署在服务器端。PaddleX 的模型发布界面如图 15 所示:

图 15 模型发布

发布的文件主要有两部分:推理代码和模型。如图 16 所示,模型保存在 inference_model 文件夹内,在使用时,我们只需要加载该模型即可。

图 16 推理代码和模型

发布的文件如下图所示:

图 17 模型文件

项目小结及下节预告

在本文中,我介绍了一款非常好用的深度学习开发工具 PaddleX,特别以压力表分割为例,阐述了 PaddleX 图形化开发界面的使用方法。这一部分的内容比较简单,欢迎大家下载亲自动手试一试。下载链接:

https://www.paddlepaddle.org.cn/paddlex/userinfo

下节预告:在工业应用中,生成一个性能不错的模型只是第一步。由于工业场景需要使用 C# 开发界面,因此需要将该模型转换成 C# 可调用的 dll,下节将介绍如何将飞桨的 C++ 预测代码生成为 Visual Studio 下的解决方案,以及最关键的,如何将 C++ 预测代码生成为可调用的动态链接库 dll,打通真正可以工业实战的开发流程。都看到这里了,还不点个赞,关注一下,谢谢大家!最后,再一次欢迎大家给这款好用的工具点个 star!PaddleX Github 链接:

https://github.com/PaddlePaddle/PaddleX

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

・飞桨官网地址・

https://www.paddlepaddle.org.cn/

・飞桨开源框架项目地址・

GitHub:

https://github.com/PaddlePaddle/Paddle

Gitee:

https://gitee.com/paddlepaddle/Paddle

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-11-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GitHubDaily 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档