暂无搜索历史
人脸检测是计算机视觉应用(如人脸追踪、人脸识别、性别分类和情绪识别)的重要第一步。其主要目标是精确地定位图像中的人脸区域。特别是在密集人群(小脸)、以及恶劣条件...
物理智能正在构建旨在为可以学习广泛任务的机器人提供动力的软件,一家名为“Physical Intelligence”的初创公司已着手改变这种情况。该公司今年由机...
互动分割通过使用有限的手动标注提高扩大图像分割数据集的效率,避免了完全标记的繁琐工作。最近,Segment Anything Model (SAM) 在实时、高...
变化检测在遥感领域扮演着至关重要的角色,它使用在不同时间获取的同一地理区域的双时相图像对来追踪地球表面随时间的变化[1]。它已被广泛应用于各种应用,如灾害评估[...
目标检测在自动驾驶、视频监控和机器人操作等众多应用中至关重要。在过去的几十年里,卷积架构在检测方法上推动了显著的发展。这些算法通常需要一个人工设计的模块来生成 ...
近年来,计算机视觉领域经历了快速的增长和发展,这主要得益于深度学习的进步和大规模数据集的可用性。在众多突出的深度学习方法中,卷积神经网络(CNNs)[8]特别有...
近年来,Transformer [76]已成为各种任务的主流 Backbone 网络,支撑着诸如BERT ,GPT系列 和ViT [23]等众多杰出模型。然而,...
自从高级深度学习方法,特别是卷积神经网络(CNNs)的发展以来,它们已成为医学影像分割的主导方法,包括像U-Net、关注U-Net(AttUnet)和U-Net...
视觉跟踪的目标是在整个视频中持续定位感兴趣的目标。它是计算机视觉的基本问题,并在过去几十年因其在前瞻性应用(如视觉监控、机器人技术等)中的重要作用而受到广泛关注...
三维目标检测已成为各种导航任务的关键组成部分。与先前依赖激光雷达[23, 56, 60]或多视角图像[24, 27, 53]的研究相比,单目三维目标检测提供了一...
卷积神经网络(CNNs)在各种基于视觉的任务中表现出色,如分类、分割和目标检测(Krizhevsky等人,2012年;Chen等人,2018年;Girshick...
多目标跟踪(MOT)是计算机视觉中的基本问题之一。它在许多机器人系统(如自动驾驶)中起着关键作用。跟踪需要在视频中对感兴趣的目标进行检测并将它们跨帧关联。尽管最...
图1:使用LoRA导致的分布崩溃。由Realistic Vision 3.0模型生成的视觉结果,该模型使用LoRA和FouRA训练了“蓝火”和“折纸”风格 Ad...
在自然语言处理(NLP)中,状态空间模型(SSMs)在以线性复杂度建模长序列方面显示出巨大潜力。其中,一个最近的变体,Mamba [12],通过综合选择性扫描的...
近年来,计算机视觉与农业的交叉领域取得了显著进展,开启了一个精准农业和农业管理变革的时代。[1]在推动这一范式转变的关键技术中,You Only Look On...
受到这一洞见的启发,作者引入了一种名为Adapter-X的新框架。首先,提出了一个共享 Adapter 混合(SMoA)模块,以同时满足 Token Leve...
近期,Mamba在计算机视觉领域得到了重视,并将门控MLP []集成到H3 []的SSM中。读者可以参考以更全面地理解这一主题。在这里,作者将列出一些用于医学图...
视觉 Transformer (ViTs)通过自我注意力机制全局建模token间的交互,在图像分类中表现出令人印象深刻的性能。近期工作显示,将局部信息整合到Vi...
变化检测在遥感技术不断发展的推动下,已成为遥感界的一个热门研究领域。这项任务的目的是利用在不同时间获取的遥感图像来监测同一地区地表的变化。变化检测在诸如城市规划...
xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision(Grok-1.5V),不仅能理解文本,还能处理文档、图表、截图和...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市