前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >找了好久,终于发现一款好用到炸的「图像分割」利器!

找了好久,终于发现一款好用到炸的「图像分割」利器!

作者头像
GitHubDaily
发布2022-05-25 16:56:12
4050
发布2022-05-25 16:56:12
举报
文章被收录于专栏:GitHubDailyGitHubDaily

大家好,我是小 G。

你们知道,支撑影视人像抠图、医疗影像分析、自动驾驶感知等万亿级市场背后的核心技术是什么吗?

答案就是:图像分割技术

相比目标检测、图像分类等技术,图像分割需要将每个像素点进行分类,在精细的图像识别任务中不可替代,也是智能视觉算法工程师拥有关键核心竞争力的关键!

图 1 图像分割应用

正因如此,DeepLabv3、OCRNet、BiseNetv2、Fast-SCNN 等优秀算法层出不穷,然而在实际产业落地过程中往往需要综合考虑硬件性能、精度等多方面因素,对算法的需求也是苛刻的。

往往业界算法在保障高识别精度的情况下,就会牺牲算法运行速度;反之追求速度,则会带来精度的大幅度损失。

图 2 各算法速度与精度平衡情况示意

如何能同时实现速度和精度的均衡,在当前云、边、端多场景协同的产业大趋势下高标准满足产业需求,是各届研究人员致力投入的方向。

PP-LiteSeg 就是这样一个同时兼顾精度与速度的 SOTA(业界最佳)语义分割模型。它基于 Cityscapes 数据集,在 1080ti 上精度为 mIoU 72.0 时,速度高达 273.6 FPS , (mIoU 77.5 时,FPS 为 102.6),超越现有 CVPR SOTA 模型 STDC,真正实现了精度和速度的 SOTA 均衡。

图 3 PP-LiteSeg 精度 / 速度说明

空口无凭,欢迎优秀的你直接试用!(记得 Star 收藏跟进最新状态)

传送门:

https://github.com/PaddlePaddle/PaddleSeg

更值得令人惊喜的是,PP-LiteSeg 不仅在开源数据集评测效果优秀,在产业数据集也表现出了惊人的实力!例如在质检、遥感场景,PP-LiteSeg 的精度与高精度、大体积的 OCRNet 持平,而速度却快了近 7 倍!!!

图 4 PP-LiteSeg 和 OCRNet 在某工业质检数据集识别情况对比

图 4 PP-LiteSeg 和 OCRNet 在 deepglobe 数据集识别情况对比

那 PP-LiteSeg 为何可以拥有这么优秀的效果呢?

PP-LiteSeg 提出三个创新模块:灵活的解码模块(FLD)、注意力融合模块(UAFM)、简易金字塔池化模块(SPPM)。

  • FLD 灵活调整解码模块中通道数,平衡编码模块和解码模块的计算量,使得整个模型更加高效;
  • UAFM 模块效地加强特征表示,更好地提升了模型的精度;
  • SPPM 模块减小了中间特征图的通道数、移除了跳跃连接,使得模型性能进一步提升。

图 5 PP-LiteSeg 模型结构和优化点

正是基于这些模块的设计与改进,最终 PP-LiteSeg 超越其他方法,在 1080ti 上精度为 mIoU 72.0 时,速度高达 273.6 FPS , (mIoU 77.5 时,FPS 为 102.6),实现了精度和速度的 SOTA 平衡。更多关于 PP-LiteSeg 的内容,请参考:

https://github.com/PaddlePaddle/PaddleSeg/tree/release/2.5/configs/pp_liteseg

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-04-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GitHubDaily 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档