前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >妙用扩散模型!浙大等提出DatasetDM:生成高质量感知数据集,下游算法性能提升亮眼!

妙用扩散模型!浙大等提出DatasetDM:生成高质量感知数据集,下游算法性能提升亮眼!

作者头像
CV君
发布2023-08-31 10:28:50
3790
发布2023-08-31 10:28:50
举报
文章被收录于专栏:我爱计算机视觉

使用文本引导的扩散模型生成的合成样本,可大大改进多种下游感知算法性能,代码将开源!

▌DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion Models

论文作者:Weijia Wu,Yuzhong Zhao,Hao Chen,Yuchao Gu,Rui Zhao,Yefei He,Hong Zhou,Mike Zheng Shou,Chunhua Shen

作者单位:Zhejiang University; University of Chinese Academy of Sciences; National University of Singapore

论文链接:http://arxiv.org/abs/2308.06160v1

项目链接:https://github.com/showlab/DatasetDM https://weijiawu.github.io/DatasetDM_page/

内容简介:

1)方向:基于生成模型的数据集生成

2)应用:数据集生成

3)背景:目前深度网络对大规模数据的需求较高,但采集和标注这些数据通常耗时。相比之下,使用生成模型(如DALL-E和扩散模型)可以生成无限数量的合成数据。

4)方法:本文提出了DatasetDM,一种通用的数据集生成模型,可以生成多样的合成图像以及相应的高质量感知标注。所提出方法基于预训练的扩散模型,将文本引导的图像合成扩展到感知数据生成。扩散模型的潜在代码可以通过解码器模块有效地解码为准确的感知标注。解码器只需使用少于1%(约100张图像)的手动标记图像进行训练,从而实现了无限大的带标注数据集的生成。随后,这些合成数据可用于训练各种感知模型以用于下游任务。

5)结果:通过所提出方法生成的数据集在各种下游任务中展示了强大的性能,包括语义分割、实例分割和深度估计。尤其值得注意的是,它在语义分割和实例分割方面取得了最先进的结果,并且在域泛化方面比仅使用真实数据更加稳健;在零样本分割设置中实现了最先进的结果;同时具备高效应用和新任务组合(例如图像编辑)的灵活性。

项目网站:

https://weijiawu.github.io/DatasetDM_page

代码:

https://github.com/showlab/DatasetDM

整体架构:

GPT-4与扩散模型协同:

生成的数据示例:

新数据集加持,感知算法性能提升显著:

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 我爱计算机视觉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档