前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CVPR 2021 顶会冠军图像分割算法全解密

CVPR 2021 顶会冠军图像分割算法全解密

作者头像
数据派THU
发布2023-03-29 13:16:43
1.5K0
发布2023-03-29 13:16:43
举报
文章被收录于专栏:数据派THU
代码语言:javascript
复制
来源:DataFunTalk
本文约1400字,建议阅读5分钟 本文为大家介绍 CVPR 2021 顶会冠军图像分割算法。

以Tesla为首的全球各大新势力造车企业最近简直火的不能再火,过山车似的股价也足以证明各界对自动驾驶行业炽烈的期待! 而Tesla经过多方面权衡最终采用纯视觉识别的方案,这种方案相比激光雷达方案有更低成本以及更强的统一性。而图像分割技术,作为视觉识别技术中举足轻重的模块,是智能车得以精准区分哪里是路,哪里是人的关键!

而今天我们要给大家介绍的这个项目,它不仅涵盖业界最主流的DeepLab、UNet等23个系列60多个语义分割算法及预训练模型, 还新发布了在全球计算机视觉顶会CVPR2021上AutoNUE挑战中获得冠军的语义分割算法,还有实时高精度人像分割算法PPSeg、即将开源的精细化的分割PaddleSeg-Matting、全景分割算法Panoptic-DeepLab!

不仅如此,它还提供基于交互式分割算法的智能标注工具 EISeg!

Web 视频会议  

Matting

全景分割

交互式分割

简而言之,这个项目可以全方位、立体式地满足开发者在图像分割方向各个维度的需求。不得不大说一声:

这么好的产品,还不赶紧Star收藏起来细细研究?!

上车地址:

https://github.com/PaddlePaddle/PaddleSeg

产业级人像分割模型PPSeg 

人像分割技术的应用可谓无所不在!比如抠图、视频会议换背景、人体姿态分析等等。但往往数据来源和算法部署环境非常多样,有手机的、固定摄像头的、移动车载摄像头的等等,不仅如此,不同的光照条件也为人像分割算法带来了极大的考验。基于这样的产业难点,PaddleSeg团队推出了在大规模人像数据上训练的人像分割PPSeg模型,并针对服务端、移动端、Web端(Paddle.js)多种使用场景进行了不同的优化,都获得超群的效果。

而近期“百度视频会议”也上线了虚拟背景功能,通过Padddle.js实现了在web端部署,支持用户在视频会议时进行背景切换。

小伙伴们可以直接去百度首页体验百度视频会议,直观感受PaddleSeg和Paddle.js的能力。

精细化的分割解决方案 PaddleSeg-Matting

随着分割技术的发展,人们对分割的精细化的要求也越来越高。比如在一些影视行业,绿幕作为拍摄的换背景常用的工作,但目标不在绿幕前拍摄,是否还能达到很好的背景分割功能呢?

答案是:能!

最近PaddleSeg团队开源的精细化分割解决方案PaddleSeg-Matting就很好的解决了这个问题。将目标的发丝实现了精准的分割。

交互式分割智能标注工具 

业界对于人工智能有这么一句话:“深度学习有多智能、背后就有多少人工”。这句话直接说出了深度学习从业者心中的痛处,毕竟模型的好坏数据占据着很大的因素,但是数据的标注成本却让很多从业的小伙伴们感到头疼。

因此,PaddleSeg团队联合PaddleCV-SIG成员基于RITM算法,推出了业界首个高性能的交互式分割工具EISeg。它可以通过一系列的绿色点(正点)和红色点(负点)实现对目标对象边缘精准的分割,可以用于图像编辑、半自动标注,从而实现精细化标注,抠图,辅助图像后期处理(例如PS)等场景应用。

PaddleSeg还支持对RITM模型的训练、预测及交互的全流程。我们利用百度自建人像数据集对模型Finetune,得到预测速度快,精度高,交互点少的人像交互式分割模型。

全景分割 Panoptic-DeepLab 

全景分割是图像分割领域在近年来兴起的一个新领域,它融合了语义分割和实例分割的技术,可以识别出已知可数对象(例如车、动物等)的实例语义信息;而对于未知不可数对象(例如沙滩、天空等)识别出单纯的语义信息。

而PaddleSeg提供的全景分割算法--Panoptic DeepLab以简单的网络结构实现了精度、速度双超越,开创了全景分割算法新方向,也是当前Cityscape全景分割榜首采用的算法。

你还在等什么?!如此用心研发的高水准产品,还不赶紧Star收藏上车!

传送门:

https://github.com/PaddlePaddle/PaddleSeg

编辑:于腾凯

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-07-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据派THU 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 产业级人像分割模型PPSeg 
  • 精细化的分割解决方案 PaddleSeg-Matting
  • 交互式分割智能标注工具 
相关产品与服务
大模型视频创作引擎
大模型视频创作引擎(Video Creation Large Model),是一款提供视频生成和视频处理能力的API技术服务。 该服务基于腾讯视频生成大模型等一系列领先的音视频AI技术,支持高质量地生成或处理视频内容。既能帮助专业视频创作者降低制作成本、发现视频创意,又能提升视频社交娱乐的趣味性。可广泛应用于短视频平台、影视制作、广告营销、社交媒体、游戏等领域。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档