首页
学习
活动
专区
工具
TVP
发布

AIWalker

专栏作者
217
文章
236956
阅读量
29
订阅数
SeemoRe | 专家挖掘促进更高效超分方案,Radu Timofte团队提出SeemoRe
从低分辨率(LR)输入重建高分辨率(HR)图像对图像超分辨率(SR)提出了重大挑战。虽然最近的方法已经证明了各种目标定制的复杂操作的有效性,但这些不同操作的直接堆叠可能会导致大量的计算负担,从而妨碍它们的实际用途。
AIWalker
2024-03-26
1690
CVPR2024 | DCNv4来袭,更快收敛、更高速度、更高性能!
https://arxiv.org/pdf/2401.06197.pdf https://github.com/OpenGVLab/DCNv4
AIWalker
2024-03-18
2450
CVPR2024 | 面向语义感知真实图像超分,港理工张磊团队提出了SeeSR,已开源
受益于由于强大的生成先验,预训练的文本到图像(T2I)扩散模型在解决现实世界图像超分辨率问题中变得越来越流行。然而,由于输入低分辨率(LR)图像质量严重下降,局部结构的破坏可能导致图像语义模糊,进而导致再现的高分辨率图像的内容可能具有语义错误,从而使超分辨率性能恶化。
AIWalker
2024-03-07
3610
"羊驼"入侵CV,美团&浙大沈春华团队将LLaMA向CV扩展,构建全新基础模型VisionLLaMA
大型语言模型构建在基于Transformer的架构之上来处理文本输入, LLaMA 系列模型在众多开源实现中脱颖而出。类似LLaMa的Transformer可以用来处理2D图像吗?在本文中,我们通过提出一种类似 LLaMA 的朴素和金字塔形式的Transformer来回答这个问题,称为 VisionLLaMA。VisionLLaMA 是一个统一的通用建模框架,用于解决大多数视觉任务。
AIWalker
2024-03-07
1380
CVPR2024 | Dropout之后又一改善图像超分泛化性能的正则方案SimpleAlign,已开源!
深度学习为图像超分辨率(SISR)带来了性能上的巨大飞跃。大多数现有工作都假设一个简单且固定的退化模型(例如双三次下采样),但 Blind SR 的研究旨在提高未知退化情况下的模型泛化能力。最近,Kong等人率先研究了一种更适合使用 Dropout 的 Blind SR 训练策略RDSR。尽管这种方法确实通过减轻过度拟合带来了实质性的泛化改进,但我们认为 Dropout 同时引入了不良的副作用,损害了模型忠实重建精细细节的能力。
AIWalker
2024-03-07
1660
CVPR2024 | 进一步提升超分重建质量,中科大提出用于图像超分的语义感知判别器SeD,即将开源
生成对抗网络(GAN)已被广泛用于恢复图像超分辨率(SR)任务中的生动纹理。判别器使 SR 网络能够以对抗性训练的方式学习现实世界高质量图像的分布。然而,这种分布学习过于粗粒度,容易受到虚拟纹理的影响,导致生成结果违反直觉。
AIWalker
2024-03-07
4520
CVPR2024 | 加速Diffusion,韩松团队提出分布式并行推理方案DistriFusion,加速6.1倍,质量不下降
扩散模型在合成高质量图像方面取得了巨大成功。然而,由于巨大的计算成本,利用扩散模型生成高分辨率图像仍然具有挑战性,导致交互式应用程序的延迟过高。在本文中,我们提出DistriFusion通过利用多个 GPU 的并行性来解决这个问题。我们的方法将模型输入拆分为多个块,并将每个块分配给GPU。
AIWalker
2024-03-07
1890
HDSRNet | 入局图像超分,异构动态卷积玩出新花样~
卷积神经网络可以通过深度网络架构和给定的输入样本自动学习特征。然而,所获得的模型的鲁棒性在不同的场景中可能具有挑战性。网络架构的差异越大,有利于提取更多的互补结构信息,从而增强获得的超分辨率模型的鲁棒性。
AIWalker
2024-03-01
1170
超越SwinIR,Mamba入局图像复原,达成新SOTA
最近,选择性结构化状态空间模型(例如 Mamba)在具有线性复杂性的远程依赖关系建模方面表现出了巨大的潜力,但它在低级计算机视觉中仍处于探索之中。
AIWalker
2024-02-29
4020
起飞咯,DEYO | YOLOv8赋能DETR构建检测达成检测新标杆
DETR的训练范式在很大程度上取决于在ImageNet数据集上预训练其骨干。然而,由图像分类任务和一对一匹配策略提供的有限监督信号导致DETR的预训练不充分的颈部。此外,在训练的早期阶段匹配的不稳定性会导致DETR的优化目标不一致。
AIWalker
2024-02-29
4060
BRIA.AI开源最强AI一键抠图模型RMBG,超简上手体验
近日,BRIA.AI团队于HuggingFace开源了一个基于ISNet背景移除模型RMBG-1.4,它可以有效对前景与背景进行分离。RMBG-1.4在精心构建的数据集上训练而来,该数据包含常规图像、电商、游戏以及广告内容,该方案达到了商业级性能,但仅限于非商业用途。关于所用到的训练数据:12000+高质量&高分辨率像素级精度手工标注。更详细的数据分布介绍请移步[RMBG-1.4].
AIWalker
2024-02-17
1.1K0
北大等提出MoE-LLaVA:将多模态大模型稀疏化
https://github.com/PKU-YuanGroup/MoE-LLaVA
AIWalker
2024-02-17
2480
端侧高效骨干RepGhost | 重参数赋能GhostNet,达成端侧超高效骨干
https://github.com/ChengpengChen/RepGhost
AIWalker
2024-02-17
1200
ICCV2021 | MIMO-UNet:重新思考CTF方案达成去模糊新高度
Coarse-to-fine(CTF)策略已被广泛应用到图像去模糊领域,常规方法通常通过堆叠多尺度输入的子网络渐进提升提升输出图像的锐利度。比如DeepBlur、SRN所采用的处理策略。
AIWalker
2024-01-30
2210
Depth Anything | 致敬SAM,港大&字节提出用于任意图像的深度估计大模型,已开源!
本文提出一种用于单目深度估计(Monocular Depth Estimation, MDE)的高度实用方案Depth Anything「致敬Segment Anything」,它旨在构建一种可以处理任务环境下任意图像的简单且强力的基础深度模型。为此,作者从三个维度进行了探索:
AIWalker
2024-01-23
1.3K0
盲图像超分 MANet:ETH团队提出空间可变模糊核估计新思路
arXiv https://arxiv.org/pdf/2108.05302.pdf,
AIWalker
2024-01-17
2550
MiOIR | 直面 “多合一”图像复原,港理工张磊团队提出MiOIR,融顺序学习与提示学习于一体!
尽管单任务图像复原已取得了极大成功,但单模型处理多复原任务仍极具挑战。本文对 “多合一”图像复原任务进行了深入探索并指出其所面临的两个关键挑战并提出了对应的应对方案:
AIWalker
2024-01-17
2550
YOLOv8重磅升级,新增旋转目标检测,又该学习了~
然后,照一张航拍图像将其命名为"data.png",你还需要把预训练模型下载下载放到"weights"目录下;
AIWalker
2024-01-11
1.5K0
语义分割新SOTA:80.5mIoU+62.8FPS! 华科与美团联合提出单分支推理分割架构SCTNet,即将开源!
最新的实时语义分割方法通常采用额外的语义分支来追求丰富的长距离上下文。然而,额外的分支会带来不必要的计算开销,并减缓推理速度。为了消除这一困境,我们提出了SCTNet,一种带有transformer语义信息的单分支CNN用于实时分割。
AIWalker
2024-01-02
1.1K0
BFRffusion | 面向真实世界的盲人脸复原,中山大学提出全新盲人脸复原基准数据集
人脸盲复原是计算机视觉领域的一个重要课题,由于其广泛的应用而受到人们的广泛关注。在这项工作中,我们深入研究了利用预训练的稳定扩散进行盲脸恢复的潜力,
AIWalker
2024-01-02
2620
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档