专栏首页PaddlePaddle算法SOTA、功能全面、性能最佳,PaddleDetection 2.0重磅升级!

算法SOTA、功能全面、性能最佳,PaddleDetection 2.0重磅升级!

目标检测技术作为视觉技术届的顶梁柱,不仅单兵作战在人脸、车辆、商品、缺陷检测等场景有出色的表现,也是文本识别,图像检索、视频分析、目标跟踪等复合技术的核心模块,应用场景可谓比比皆是。

各界开发者对高精度、高效率的目标检测算法,以及便捷高效的开发、部署方式的追求可谓是极致的。但业界却缺少全面兼顾高性能算法、便捷开发、高效训练及完备部署的开源目标检测项目。百度飞桨端到端目标检测开发套件PaddleDetection重磅升级为2.0版本后,终于全面兼顾业界开发者的需求,成长为中国产业实践中目标检测领域一柄重器。

让我们先来概览一下PaddleDetection2.0本次升级内容:

  1. 全明星算法阵容:

新增超越YOLOv4、YOLOv5 的PP-YOLOv2,1.3M 超超超轻量目标检测算法PP-YOLO Tiny,全面领先同类框架的RCNN系列算法,以及SOTA 的Anchor Free算法:PAFNet(Paddle Anchor Free)

  1. 全面功能覆盖:

除全系列通用目标检测算法外,额外覆盖旋转框检测、实例分割、行人检测、人脸检测、车辆检测等垂类任务。

  1. 易用性全面提升:

全面支持动态图开发,压缩、部署等全流程方案打通,极大程度的提升了用户开发的易用性,加速了算法产业应用落地的速度。

图1 PaddleDetection2.0明星通用目标检测模型的性能

着急的小伙伴可以直接传送门前往开源项目主页直接体验:

https://github.com/PaddlePaddle/PaddleDetection

而本篇也将为大家详细解读一下PaddleDetection2.0的升级内容,初步领略下这个检测重器的杀伤力:

一、更多更好的算法

1. PPYOLOv2,比YOLOv4、YOLOv5更强!

自去年PPYOLO一度成为产业实践最佳目标检测模型后,随着PaddleDetection2.0的发布,PPYOLO也推出了v2版本。延续v1版本的理念,PPYOLOv2持续深化考虑在产业实践中需要兼顾算法的精度和速度,PPYOLOv2(R50)mAP从45.9%达到了49.5%,相较v1提升了3.6个百分点,FPS高达106.5FPS,超越了YOLOv4甚至YOLOv5!而如果使用RestNet101作为骨架网络,PPYOLOv2(R101)的mAP更高达50.3%,并且比同等精度下的YOLOv5x快15.9%!!!

完整论文请参考:

https://arxiv.org/abs/2104.10419

你无需再在眼花缭乱的目标检测算法中对比选择,用PP-YOLOv2就对了!

图 2 PP-YOLOv2 性能比较

2. PPYOLO Tiny,1.3M

比YOLO-Fastest、NanoDet更轻量!

随着物联网的快速发展,端侧芯片部署轻量化深度学习算法的需求越来越强烈,基于此,PaddleDetection 2.0 推出了经过深度优化后,体积仅为1.3M的超超超轻量目标检测算法—PPYOLO Tiny。如下表所示,在coco val2017数据集测试,输入尺寸320px版本,mAP达到20.6,单张预测时延10.83ms(92.3FPS);输入尺寸416px版本,mAP达到22.7,单张预测时延15.48ms(64.6FPS)。比YOLO-Fastest、 NanoDet更强!

图 3 PP-YOLO Tiny性能

3. RCNN系列算法全面超越同类开发工具!

除了YOLO系列之外,PaddleDetection2.0 还将目标检测的基础两阶段系列算法--RCNN进行了整体升级。如表1可以清晰的看到,RCNN系列模型(Faster RCNN, Mask RCNN, Cascade RCNN等)在PaddleDetection进行训练,比mmDetection和Detectron2在更短的时间获得更高的精度!

表1:RCNN系列模型在PaddleDetection、mmDetection和Detectron2开发套件下

在COCO 2017 val集上的mAP对比结果

4. SOTA Anchor Free算法:

PAFNet(Paddle Anchor Free)& PAFNet-Lite

相较于SSD、RCNN等系列各种Anchor-Based算法,Anchor-Free算法拥有更少的超参、更易配置、对多尺度目标检测效果更好等优点,但也存在检测结果不稳定、训练时间长等问题,是近些年科研领域的热点方向。飞桨当然一直紧跟全球科研动向,基于TTFNet进行多维度的优化,推出了在COCO数据集精度42.2,V100预测速度67FPS, 处于anchor free领域SOTA水平的PAFNet(Paddle Anchor Free)算法!同时提供移动端轻量级模型PAFNet-Lite,COCO数据集精度达到23.9,麒麟990芯片延时26ms。

完整论文请参阅:

https://arxiv.org/abs/2104.13534

图 4 PAFNet网络结构

5. 旋转框检测算法—S2ANet

在一般的的目标检测项目中,我们通常使用水平矩形框为检测框对目标进行框定。而在产业场景中,例如质检、遥感图像,目标往往是任意方向排列且长宽比差别比较大的, 用水平矩形框则会出现大量空白非目标的区域,且丢失了目标的朝向角度信息,例如图5 精度不能满足业务需求。旋转框目标检测算法就可以很好的解决这类问题,它在检测出四边形矩形框的同时可以同时获得旋转角度。PaddleDetection 2.0本次的升级,就新增了高性价比旋转框检测算法--S2ANet,方便开发者直接取用或进一步开发。

至此PaddleDetection共包含了19类共231个模型算法,其中动态图预训练模型70个,静态图预训练模型161个。其中包括PPYOLO、RCNN、PAFNet系列等明星算法!!!覆盖通用目标检测、人脸检测、行人检测、车辆检测、旋转框检测、实例分割任务,得益于飞将框架和PaddleDetection套件本身的设计,算法训练的效率也超越同类开发工具!

二、更好的易用性

1. 动态图开发,灵活调试代码

PaddleDetection 2.0基于PaddlePaddle 2.0.1版本,默认使用动态图进行开发,在这种模式下,每次执行一个运算,可以立即得到结果,而不是事先定义好网络结构再执行。用户也可以快速获取网络结构、每层输入输出和对应梯度信息等,并对应进行快速调整。这样用户可以更快速的组织代码,更容易的调试程序。

2.更便捷的安装方式

除了传统的git clone方式,PaddleDetection 2.0这次还新增了whl包的发布,用户可以直接通过pip install的方式安装,由此可以通过import ppdet的方式调用PaddleDetection 2.0下的API快速完成自己的检测任务。

三、训练、压缩、部署全流程打通

为了进一步加速深度学习算法的产业落地,PaddleDetection 2.0动态图顺畅打通了算法的全流程部署。

图7 PPDet全流程方案

在完成模型训练过程中或之后,PaddleDetection2.0方便支持开发者使用PaddleSlim对算法进行量化、蒸馏、裁剪等压缩优化,并支持快速将模型由动态图转化为静态图,实现模型的高效多平台预测部署。

1. 模型压缩能力

为了满足开发者对计算量、模型体积、运算速度等极致的追求,PaddleDetection 2.0动态图模式下基于PaddleSlim新增了多种模型压缩能力,包括剪裁,量化,蒸馏以及剪裁+蒸馏联合策略压缩方案,可大幅减少模型参数或者计算量,便于部署在受限的硬件环境中。由下表可以看出,量化策略为模型带来1.7%的精度提升,同时体积压缩3.71倍,速度提升1.46倍!而采用蒸馏+裁剪的联合策略,在精度几乎无损的情况下,体积压缩了3.05倍,加速1.58倍!

表3:基于YOLOv3-MobileNetv1模型进行模型压缩的效果对比

2. 预测部署能力

得益于飞桨预测库系列产品Paddle Inference、Paddle Lite和Paddle Serving的能力,PaddleDetection 2.0支持开发者快速在Linux、Windows、NV Jetson等多系统多平台进行算法部署,同时提供了Python预测和C++预测两种方式,覆盖主流目标检测算法。另外适配TensorRT,支持TensorRT动态尺寸输入及TensorRT INT8量化预测, 全面支持用户进行硬件加速。

表4:Tesla V100上各主流算法预测速度对比

小结:

本次PaddleDetection2.0的重磅升级,为开发者提供了目标检测领域全新的开发体验, mAP 50.3 的PP-YOLOv2超越YOLOv4、YOLOv5,1.3M 超轻量PP-YOLO Tiny超越YOLO-Fastest、NanoDet,RCNN系列算法全面领先其他框架水平,PAFNet(PaddleAnchorFree)SOTA,还覆盖了旋转框检测、实例分割、行人检测、人脸检测、车辆检测等任务。动态图的升级和全流程方案的打通,极大程度的提升了用户开发的易用性。不论你是学术科研工作者,还是产业开发者;不论你是刚入门的萌新,还是已经历练成为大神,PaddleDetection 2.0都能帮你更快的进行算法实验、获得高性能的目标检测算法、投入产业实用。

如此用心制作的高水准产品,期待业界开发者参与一同共建!

参考链接

更多PaddleDetection信息,欢迎访问GitHub点star后体验:

https://github.com/PaddlePaddle/PaddleDetection

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END

本文分享自微信公众号 - PaddlePaddle(PaddleOpenSource)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2021-04-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 飞桨端到端开发套件揭秘:低成本开发的四大秘密武器

    11 月 5 日,在 Wave Summit+2019 深度学习开发者峰会上,飞桨全新发布和重要升级了最新的 21 项进展,在深度学习开发者社区引起了巨大的反响...

    量子位
  • YOLOv3比原作高10个点,飞桨更新至73个视觉算法、203个预训练模型

    随着防控措施效果显现,新冠疫情在全国范围内已经得到了控制。当我们走进地铁与车站,甚至很多小区与超市,都会看到口罩人脸检测系统与红外测温系统,这些都是人工智能在疫...

    机器之心
  • 目标检测神器来了!

    刚刚全面升级的PaddleDetection2.0,它全面兼顾高性能算法、便捷开发、高效训练及完备部署,也因此受到广大开发者的喜爱,连续登录Github全球趋势...

    Datawhale
  • 基于PaddleDetection的锥桶检测并在Gazebo环境中实现部署

    【飞桨开发者说】吴瀚,武汉理工大学本科在读,人工智能技术爱好者、飞桨开发者,希望能将AI技术更好地落地实践、服务生活。感兴趣的方向有:计算机视觉、迁移学习、推理...

    用户1386409
  • 超越YOLOv5!1.3M超轻量,又好又快!目标检测神器来了

    不论你需要通用目标检测、实例分割、旋转框检测,还是行人检测、人脸检测、车辆检测等垂类算法;

    Amusi
  • 本周AI热点回顾:GAN压缩法使算力消耗不到1/9,开源生成器让你的照片秒变手绘日漫

    尽管最近 2019 年的图灵奖颁给了计算机图形学、颁给了皮克斯 3D 动画,但很多人可能认为二维动漫更有意思一些。像宫崎骏、新海诚这些大师手绘下的动漫,才有了灵...

    用户1386409
  • 超越YOLOv5还不够!这个目标检测开源项目又上新了

    作为目标检测领域的扛把子,PaddleDetection当然不仅仅提供通用目标检测算法,还拥有多个业界先进、实用的关键点检测和多目标跟踪算法。除了可以准确识别、...

    Amusi
  • YOLOv3 精度再次提高 4.3%,训练提速 40%!PaddleDetection全面升级

    喜欢看科幻电影的朋友一定会对这样的画面印象深刻:钢铁侠去解救被恐怖分子挟持的人质时,他的战衣可以快速的从人群之中识别持有武器的恐怖分子,并确定恐怖分子的位置,然...

    CV君
  • 超越YOLOv5,1.3M超轻量,高效易用,这个目标检测开源项目太香了!

    这个目标检测神器简直香炸了!它不仅连续登录Github全球趋势榜,拥有的全球尖端算法论文也接连登录全球技术趋势榜PaperWithCode。

    昱良

扫码关注云+社区

领取腾讯云代金券