整理:AI算法与图像处理
CVPR2022论文和代码整理:https://github.com/DWCTOD/CVPR2022-Papers-with-Code-Demo
ECCV2022论文和代码整理:https://github.com/DWCTOD/ECCV2022-Papers-with-Code-Demo
主页:https://luckyhzt.github.io/unicolor
摘要:
我们提出了第一个统一框架 UniColor 来支持多种模式的着色,包括无条件和有条件的,例如笔画、示例、文本,甚至它们的混合。我们没有为每种类型的条件学习单独的模型,而是引入用于将各种条件合并到单个模型中的两阶段着色框架。在第一阶段,将多模态条件转换为提示点的共同表示。在第二阶段,我们提出了一个基于 Transformer 的网络,由 Chroma- VQGAN 和 Hybrid-Transformer 可根据提示点生成多样化和高质量的着色结果。定性和定量比较都表明,我们的方法在每种控制模态中都优于最先进的方法,并进一步实现了多模态着色以前不可行。tive 界面展示了我们统一框架在实际使用中的有效性,包括自动着色、混合控制着色、局部重新着色和迭代颜色编辑。
StyleSwap: Style-Based Generator Empowers Robust Face Swapping
AdaFocusV3: On Unified Spatial-temporal Dynamic Video Recognition
UAV-based Visual Remote Sensing for Automated Building Inspection
DELTAR: Depth Estimation from a Light-weight ToF Sensor and RGB Image
Globally Optimal Event-Based Divergence Estimation for Ventral Landing
Diversified Dynamic Routing for Vision Tasks
Totems: Physical Objects for Verifying Visual Integrity
Learning State-Aware Visual Representations from Audible Interactions
Motion Transformer with Global Intention Localization and Local Movement Refinement
UniCLIP: Unified Framework for Contrastive Language-Image Pre-training
Text-Adaptive Multiple Visual Prototype Matching for Video-Text Retrieval
EPIC-KITCHENS VISOR Benchmark: VIdeo Segmentations and Object Relations
Efficient Non-Parametric Optimizer Search for Diverse Tasks