语义分割是一项传统的任务,需要大量的像素级地面真实标签数据集,获取这些数据既费时又昂贵。最近在弱监督设置方面的进展表明,仅使用图像级别标签就可以获得合理的性能。...
室外场景的多模态大尺度数据集大多是针对城市驾驶问题而设计的。这些场景是高度结构化的,语义上不同于在以自然为中心的场景中看到的场景,如花园或公园。为了促进机器学习...
视觉语义嵌入(VSE)是视觉语言检索的一种主流方法,其目标是学习一个深度嵌入空间,使视觉数据嵌入在语义文本标签或描述附近。最近的VSE模型使用复杂的方法来更好地...
在人工智能(AI)的参与下,可以在特定主题下自动生成草图。尽管之前的研究在这方面取得了突破,但相对较高的比例生成的图形过于抽象,无法识别,这说明AIs在绘制时无...
尽管在目标检测和少镜头学习方面取得了实质性进展,但基于单一示例的检测对象——单镜头目标检测——仍然是一个挑战:训练后的模型显示出巨大的推广差距,其中在训练期间使...
单目深度预测是近年来研究的热点,但由于缺乏真实世界的数据集和基准,在光照和季节变化等多种环境下的深度预测研究较少。在本工作中,我们从CMU视觉定位数据集通过结构...
半监督视频对象分割(semi-VOS)广泛应用于许多领域。这个任务是通过一个给定的分割掩码跟踪类无关的对象。为了做到这一点,基于光流、在线学习和记忆网络的各种方...
深度学习方法已经非常成功地解决了许多复杂的任务,如图像分类和分割,语音识别和机器翻译。然而,由于超参数搜索空间大、训练时间长以及缺乏超参数选择的技术指导原则,手...
黑色素瘤是世界上最常见的皮肤癌。目前,该病由皮肤科专家诊断,费用昂贵,需要及时就医。深度学习的最新进展有可能提高诊断性能,加快紧急转诊和减轻临床医生的负担。通过...
大多数传统的监督超分辨率(SR)算法假设低分辨率(LR)数据是通过具有固定已知核的高分辨率(HR)数据进行降尺度获得的,但这样的假设在实际场景中往往不成立。最近...
基于体素的三维对象分类是近年来研究的热点。以往的方法通常直接将经典的二维卷积转换为应用于具有二进制体素表示的对象的三维形式。在本文中,我们研究了为什么二进制体素...
本文提出了一种基于学习的方法来计算判别三维点云描述子,用于位置识别。现有的方法,比如PointNetVLAD,是基于无序点云表示的。他们使用PointNet作为...
稀疏逼近是从冗余字典中找出信号的最小线性组合的问题,在信号处理和压缩感知中有着广泛的应用。在这个项目中,我尝试实现正交匹配追踪(Orthogonal Match...
我们处理图像分解成反照率和阴影的问题。我们提出了快速傅立叶本征网络,简称FFI-Net,它在光谱域中工作,把输入分解成几个光谱波段。FFI-Net的权值在谱域内...
原型图像识别被认为是黑盒深度学习模型的一种可解释的替代方法。分类取决于测试图像“看起来”原型的程度。然而,人类的知觉相似性可能不同于模型所学习到的相似性。用户不...
立体深度估计依赖于左右图像中极线上像素点之间的最佳对应匹配来推断深度。在这项工作中,我们不再匹配单个像素,而是从序列到序列对应的角度来重新讨论这个问题,以使用位...
COVID-19期间的禁闭对世界各地的农业造成了严重影响。作为一种有效的解决方案,基于目标检测和机器人收获机的机械收获/自动收获成为迫切需要。在自动收获系统中,...
尺度变化是多尺度目标检测中的一个关键问题。早期的方法通过利用图像和特征金字塔来解决这一问题,这在计算负担和固有网络结构的约束下产生了次优结果。开创性的工作还提出...
视频异常检测广泛应用于安全监控等领域,具有很大的挑战性。目前的视频异常检测方法大多采用深度重建模型,但在实际应用中,由于正常和异常视频帧之间的重建误差差不够,导...
随着强大的序列建模和丰富的环境特征提取技术的应用,人类短期运动轨迹的预测有了很大的进步。然而,长期预测仍然是当前方法的一个主要挑战,因为误差可能会在这一过程中累...
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
扫码关注云+社区
领取腾讯云代金券