首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

ECCV 2022 | VisDB:基于学习的密集人体鲁棒估计

从单目图像估计 3D 人体姿势和形状是动作重定向、虚拟化身和人类动作识别等各种应用的关键任务。这是一个具有根本挑战性的问题,因为深度模糊和人类外表的复杂性会随着关节、衣服、照明、视角和遮挡而变化。为了通过紧凑的参数表示复杂的 3D 人体,诸如 SMPL 之类的基于模型的方法已在社区中得到广泛使用。然而,SMPL 参数以整体方式表示人体,导致通过直接它们的参数无法灵活适应真实世界图像。更重要的是,当人体在图像中不完全可见时,基于回归的方法往往会失败,例如,被遮挡或在框架外。在这项工作中,作者的目标是学习与输入图像并且对部分身体情况具有鲁棒性的人体估计。

02

DSNet:Joint Semantic Learning for Object

近五十年来,基于卷积神经网络的目标检测方法得到了广泛的研究,并成功地应用于许多计算机视觉应用中。然而,由于能见度低,在恶劣天气条件下检测物体仍然是一项重大挑战。在本文中,我们通过引入一种新型的双子网(DSNet)来解决雾环境下的目标检测问题。该双子网可以端到端训练并共同学习三个任务:能见度增强、目标分类和目标定位。通过包含检测子网和恢复子网两个子网,DSNet的性能得到了完全的提高。我们采用RetinaNet作为骨干网络(也称为检测子网),负责学习分类和定位目标。恢复子网通过与检测子网共享特征提取层,采用特征恢复模块增强可见性来设计。实验结果表明我们的DSNet在合成的有雾数据集上达到了50.84%的mAP,在公开的有雾自然图像数据集上达到了41.91%的精度。性能优于许多最先进的目标检测器和除雾和检测方法之间的组合模型,同时保持高速。

02

清华大学&英伟达最新|Occ3D:通用全面的大规模3D Occupancy预测基准

自动驾驶感知需要对3D几何和语义进行建模。现有的方法通常侧重于估计3D边界框,忽略了更精细的几何细节,难以处理一般的、词汇表外的目标。为了克服这些限制,本文引入了一种新的3D占用预测任务,旨在从多视图图像中估计目标的详细占用和语义。为了促进这项任务,作者开发了一个标签生成pipeline,为给定场景生成密集的、可感知的标签。该pipeline包括点云聚合、点标签和遮挡处理。作者基于Waymo开放数据集和nuScenes数据集构造了两个基准,从而产生了Occ3D Waymo和Occ3D nuScene基准。最后,作者提出了一个模型,称为“粗略到精细占用”(CTF-Occ)网络。这证明了在3D占用预测任务中的优越性能。这种方法以粗略到精细的方式解决了对更精细的几何理解的需求。

04

Solidworks 2023中文版下载安装激活 附安装教程

伴随着2023年的钟声即将响起,很多软件都迎接了2023年的版本,今日小编为大家带来了这款:SOLIDWORKS 2023,这是一款在设计领域非常著名的三维机械设计软件,同时也是世界上第一个基于Windows开发的三维CAD系统,简称叫做“SW 2023”,现阶段具备三大特色,分别是:功能强大、易学使用、技术创新,能够为用户提供出以整套实体模型设计系统,可以很好的满足用户机械设计办公的需求。值得一提的是:SOLIDWORKS 2023在安装过程以及操作界面,都更加人性化了,即便你是新手用户,也是可以快速安装上手。不仅如此,SOLIDWORKS 2023采用了先进的Windows OLE技术、直观式设计技术以及良好的与第三方软件的集成技术,再搭配上由剑桥提供的Parasolid内核,拥有丰富的模型创建、编辑实用程序、布尔建模运算符、特征建模支持、先进表面处理、增厚与弧刮等等,让用户在这里创建模型可以更加轻松。

05

用于大规模视觉定位的直接2D-3D匹配(IROS 2021)

摘要:估计图像相对于 3D 场景模型的 6 自由度相机位姿,称为视觉定位,是许多计算机视觉和机器人任务中的一个基本问题。在各种视觉定位方法中,直接 2D-3D 匹配方法由于其计算效率高,已成为许多实际应用的首选方法。在大规模场景中使用直接 2D-3D 匹配方法时,可以使用词汇树来加速匹配过程,但这也会引起量化伪像,从而导致内点率降低,进而降低了定位精度。为此,本文提出了两种简单有效的机制,即基于可见性的召回和基于空间的召回,以恢复由量化伪像引起的丢失匹配。从而可以在不增加太多的计算时间情况下,大幅提高定位精度和成功率。长期视觉定位 benchmarks 的实验结果,证明了我们的方法与SOTA相比的有效性。

01

充分利用NVIDIA Nsight开发工具发挥Jetson Orin的最大潜力

Orin 架构以行业领先的性能为下一代边缘 AI 系统提供动力,该系统由 12 个 ARM Cortex A78 内核和 2 MB 三级缓存, NVIDIA Ampere 架构 GPU 提供 16 个流式多处理器或每个 SM 128 个 CUDA 内核的 SM,Orin 还具有用于工作负载的专用加速器,用于视频缩放、图像处理,还有光流加速器即OFA、2 个 JPEG 解码器、2 个深度学习加速器单元或支持张量 RT 的 DLA,用于深度学习操作,还有可编程视频加速器(PVA)和视频编解码引擎。Orin 使用高带宽 LPDDR5 内存,并具有一组丰富的 IO 连接选项,包括 22 个 PCI Express 通道、4 个千兆以太网连接器和 16 个 CSI 通道。凭借所有这些强大的功能,Jetson Orin 完全有能力应对边缘 AI 场景。

04

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券