腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

AIWalker

专栏作者

217

文章

236956

阅读量

29

订阅数

SeemoRe | 专家挖掘促进更高效超分方案，Radu Timofte团队提出SeemoRe

架构连接模型效率部署

从低分辨率（LR）输入重建高分辨率（HR）图像对图像超分辨率（SR）提出了重大挑战。虽然最近的方法已经证明了各种目标定制的复杂操作的有效性，但这些不同操作的直接堆叠可能会导致大量的计算负担，从而妨碍它们的实际用途。

2024-03-26

1690

CVPR2024 | DCNv4来袭，更快收敛、更高速度、更高性能！

内存效率性能高性能模型

https://arxiv.org/pdf/2401.06197.pdf https://github.com/OpenGVLab/DCNv4

2024-03-18

2450

CVPR2024 | 面向语义感知真实图像超分，港理工张磊团队提出了SeeSR，已开源

对象模型软件设计开源

受益于由于强大的生成先验，预训练的文本到图像（T2I）扩散模型在解决现实世界图像超分辨率问题中变得越来越流行。然而，由于输入低分辨率（LR）图像质量严重下降，局部结构的破坏可能导致图像语义模糊，进而导致再现的高分辨率图像的内容可能具有语义错误，从而使超分辨率性能恶化。

2024-03-07

3610

"羊驼"入侵CV，美团&浙大沈春华团队将LLaMA向CV扩展，构建全新基础模型VisionLLaMA

性能编码基础架构模型

大型语言模型构建在基于Transformer的架构之上来处理文本输入, LLaMA 系列模型在众多开源实现中脱颖而出。类似LLaMa的Transformer可以用来处理2D图像吗？在本文中，我们通过提出一种类似 LLaMA 的朴素和金字塔形式的Transformer来回答这个问题，称为 VisionLLaMA。VisionLLaMA 是一个统一的通用建模框架，用于解决大多数视觉任务。

2024-03-07

1380

CVPR2024 | Dropout之后又一改善图像超分泛化性能的正则方案SimpleAlign，已开源！

开源迁移论文模型性能

深度学习为图像超分辨率（SISR）带来了性能上的巨大飞跃。大多数现有工作都假设一个简单且固定的退化模型（例如双三次下采样），但 Blind SR 的研究旨在提高未知退化情况下的模型泛化能力。最近，Kong等人率先研究了一种更适合使用 Dropout 的 Blind SR 训练策略RDSR。尽管这种方法确实通过减轻过度拟合带来了实质性的泛化改进，但我们认为 Dropout 同时引入了不良的副作用，损害了模型忠实重建精细细节的能力。

2024-03-07

1660

CVPR2024 | 进一步提升超分重建质量，中科大提出用于图像超分的语义感知判别器SeD，即将开源

开源 sed 架构模型网络

生成对抗网络（GAN）已被广泛用于恢复图像超分辨率（SR）任务中的生动纹理。判别器使 SR 网络能够以对抗性训练的方式学习现实世界高质量图像的分布。然而，这种分布学习过于粗粒度，容易受到虚拟纹理的影响，导致生成结果违反直觉。

2024-03-07

4520

CVPR2024 | 加速Diffusion，韩松团队提出分布式并行推理方案DistriFusion，加速6.1倍，质量不下降

算法同步通信分布式模型

扩散模型在合成高质量图像方面取得了巨大成功。然而，由于巨大的计算成本，利用扩散模型生成高分辨率图像仍然具有挑战性，导致交互式应用程序的延迟过高。在本文中，我们提出DistriFusion通过利用多个 GPU 的并行性来解决这个问题。我们的方法将模型输入拆分为多个块，并将每个块分配给GPU。

2024-03-07

1890

HDSRNet | 入局图像超分，异构动态卷积玩出新花样~

卷积神经网络架构模型内核网络

卷积神经网络可以通过深度网络架构和给定的输入样本自动学习特征。然而，所获得的模型的鲁棒性在不同的场景中可能具有挑战性。网络架构的差异越大，有利于提取更多的互补结构信息，从而增强获得的超分辨率模型的鲁棒性。

2024-03-01

1170

超越SwinIR，Mamba入局图像复原，达成新SOTA

工作连接模型效率性能

最近，选择性结构化状态空间模型（例如 Mamba）在具有线性复杂性的远程依赖关系建模方面表现出了巨大的潜力，但它在低级计算机视觉中仍处于探索之中。

2024-02-29

4020

起飞咯，DEYO | YOLOv8赋能DETR构建检测达成检测新标杆

性能对象架构模型数据

DETR的训练范式在很大程度上取决于在ImageNet数据集上预训练其骨干。然而，由图像分类任务和一对一匹配策略提供的有限监督信号导致DETR的预训练不充分的颈部。此外，在训练的早期阶段匹配的不稳定性会导致DETR的优化目标不一致。

2024-02-29

4060

BRIA.AI开源最强AI一键抠图模型RMBG，超简上手体验

开源 im image 模型数据

近日，BRIA.AI团队于HuggingFace开源了一个基于ISNet背景移除模型RMBG-1.4，它可以有效对前景与背景进行分离。RMBG-1.4在精心构建的数据集上训练而来，该数据包含常规图像、电商、游戏以及广告内容，该方案达到了商业级性能，但仅限于非商业用途。关于所用到的训练数据：12000+高质量&高分辨率像素级精度手工标注。更详细的数据分布介绍请移步[RMBG-1.4].

2024-02-17

1.1K0

北大等提出MoE-LLaVA：将多模态大模型稀疏化

工作可视化模型数据性能

https://github.com/PKU-YuanGroup/MoE-LLaVA

2024-02-17

2480

端侧高效骨干RepGhost | 重参数赋能GhostNet，达成端侧超高效骨干

数据性能硬件迁移架构

https://github.com/ChengpengChen/RepGhost

2024-02-17

1200

ICCV2021 | MIMO-UNet:重新思考CTF方案达成去模糊新高度

模型数据性能 ctf 架构

Coarse-to-fine(CTF)策略已被广泛应用到图像去模糊领域，常规方法通常通过堆叠多尺度输入的子网络渐进提升提升输出图像的锐利度。比如DeepBlur、SRN所采用的处理策略。

2024-01-30

2210

Depth Anything | 致敬SAM，港大&字节提出用于任意图像的深度估计大模型，已开源！

性能开源模型设计数据

本文提出一种用于单目深度估计(Monocular Depth Estimation, MDE)的高度实用方案Depth Anything「致敬Segment Anything」，它旨在构建一种可以处理任务环境下任意图像的简单且强力的基础深度模型。为此，作者从三个维度进行了探索：

2024-01-23

1.3K0

盲图像超分 MANet：ETH团队提出空间可变模糊核估计新思路

数据网络性能测试模型

arXiv https://arxiv.org/pdf/2108.05302.pdf,

2024-01-17

2550

MiOIR | 直面 “多合一”图像复原，港理工张磊团队提出MiOIR，融顺序学习与提示学习于一体！

性能优化测试模型网络

尽管单任务图像复原已取得了极大成功，但单模型处理多复原任务仍极具挑战。本文对 “多合一”图像复原任务进行了深入探索并指出其所面临的两个关键挑战并提出了对应的应对方案：

2024-01-17

2550

YOLOv8重磅升级，新增旋转目标检测，又该学习了~

框架模型数据效率用户体验

然后，照一张航拍图像将其命名为"data.png"，你还需要把预训练模型下载下载放到"weights"目录下；

2024-01-11

1.5K0

语义分割新SOTA：80.5mIoU+62.8FPS! 华科与美团联合提出单分支推理分割架构SCTNet，即将开源！

开源部署架构网络性能

最新的实时语义分割方法通常采用额外的语义分支来追求丰富的长距离上下文。然而，额外的分支会带来不必要的计算开销，并减缓推理速度。为了消除这一困境，我们提出了SCTNet，一种带有transformer语义信息的单分支CNN用于实时分割。

2024-01-02

1.1K0

BFRffusion | 面向真实世界的盲人脸复原，中山大学提出全新盲人脸复原基准数据集

设计数据算法性能隐私

人脸盲复原是计算机视觉领域的一个重要课题，由于其广泛的应用而受到人们的广泛关注。在这项工作中，我们深入研究了利用预训练的稳定扩散进行盲脸恢复的潜力，

2024-01-02

2620

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态