首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

CVPR 2023 | Next3D: 用于 3D 感知头部头像的生成神经纹理栅格化

该任务的主要挑战在于如何在生成设置中通过动画建模准确的变形并保留身份,即仅使用 2D 图像的非结构化语料库进行训练。...贡献 Next3D 提出了一种新的 3D GAN 框架,用于从非结构化 2D 图像中无监督学习生成、高质量和 3D 一致的面部化身。...这种纹理栅格化的三平面在体积表示中重新形成高维动态表面特征,以实现高效的体绘制,继承了网格驱动变形的精确控制和体积表示的表达能力。...在给定预先设计的纹理映射函数的情况下,使用标准的图形管道将神经纹理从纹理空间光栅化到基于模板网格的屏幕空间。选择神经纹理作为变形方法有两个原因。...具体来说,Next3D 将基于模板网格的神经纹理光栅化为三个正交视图,并将它们放置在三个轴对齐的特征平面中。

90930

每日学术速递12.23

,能够为基于文本或图像输入的无纹理 3D 网格生成高分辨率、无光照且多样化的 2K UV 纹理图。...本文提出了 DSFormer,一种简单的替代分解方案,它将目标权重矩阵表示为小型稠密矩阵和半结构化稀疏矩阵的乘积。由此产生的近似值更忠实于变压器中的重量分布,因此实现了更强的效率与精度权衡。...对多个自然语言理解基准的大量实验表明,DSFormer 的压缩效果比最先进的低秩分解器高出 40%,领先的半结构化稀疏基线和流行知识蒸馏方法。...明确关注反射表面的技术可以通过利用更好的反射参数化来模拟复杂而详细的反射。然而,我们观察到,这些方法在存在非反射和反射组件的真实无界场景中通常并不稳健。...我们进一步将这种表示与以从粗到细的方式训练的多分辨率网格主干相结合,从而实现比先前方法更快的重建。

18110
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    . | 分子表征的几何深度学习

    本综述的目的是: (1)对GDL在分子科学中的主要应用提供结构化和统一的综述; (2)描述该领域的主要研究方向; (3)对GDL的未来应用进行展望。...2D网格通常更有利于可视化,3D网格通常用于捕获一个(或多个)分子构象内属性的空间分布,然后将这些信息用作3D卷积神经网络(3D-CNN)的输入。...从几何角度来看,分子表面被视为3D网格,即以一组多边形(面)来描述存在于3D空间的网格坐标。...Transformers通过将序列编码为全连通图或顺序连通图(图3c),将序列数据转为为非欧几里得结构,其中每个标记仅连接到序列中的前一个标记。...3 总结与展望 化学中的几何深度学习(GDL)使研究人员能够利用不同非结构化分子表示的对称性,从而为分子结构生成和性质预测的可用计算模型带来更大的灵活性和多功能性。

    72820

    给3D资产生成高清纹理,腾讯让AI扩充游戏皮肤

    粗糙纹理生成阶段 在粗糙阶段,研究团队基于预训练的视角深度感知的 2D 扩散模型为 3D 模型生成粗糙的 UV 纹理贴图,从不同的相机视角渲染深度图,然后使用深度条件从图像扩散模型中采样图像,最后将这些图像反投影到网格表面上...为了提高每个视角中纹理网格的一致性,研究团队交替执行渲染、采样和反投影的三个过程,首先,从第一个视角将 3D 网格渲染成深度图,然后根据输入纹理条件和深度图像,利用 2D 扩散模型采样得到纹理图像: 接下来...,将这个图像从第一个视角反投影到 3D 网格上,生成该视角的纹理贴图。...在预先定义的 n 个相机视角上依次进行上述过程,融合后得到 3D 模型粗糙的纹理贴图。...为了在 UV 空间中训练扩散模型,研究人员引入了位置图来表示纹理片段的 3D 邻接信息。位置图中的每个非背景元素都是一个 3D 点坐标,可以通过将 3D 点坐标进行 UV 映射来获得。

    40510

    远距离和遮挡下三维目标检测算法研究

    本研究针对现有3D目标检测算法对存在遮挡及距离较远目标检测效果差的问题,在PointRCNN 网络的基础上对其第2阶段网络进行改进,提高目标检测的精度。...基于式(1),网格金字塔每个格子的中心点坐标可以重新表示为式中: 分别表示沿着不同坐标轴方向的放大系数,用于控制网格金字塔的尺度大小,当 均为1时,表示标准的体素化过程,随着 的增加,金字塔的尺度变大...Relu组成; 由Softmax和归一化函数组成,目的是将 所得到的注意力权重做归一化处理; 表示位置编码信息。...试验分别测试了车辆目标在简单、中等以及复杂3个等级下的检测情况。点云可视化结果中绿色的框代表预先标注好的真值框,红色的框代表算法预测的果。可视化结果如图4所示。...04 结束语针对目前3D目标检测算法对远处及存在遮挡目标物体检测精度不高的问题,以PointRCNN网络为基础进行改进,提高目标检测的精度。

    36410

    NeRFs和3D高斯溅射技术如何重塑SLAM:综述

    图9:语义可视化。来自Replica数据集的两个场景的3D语义网格(底部)及其使用RGB颜色进行分解的可视化(顶部) 图10:DEV-Indoors数据集的概览。...然而,这些方法存在诸多限制,包括对初始化的严重依赖以及在未观察区域中的原语增长控制缺失。此外,原始3DGS场景表示需要大量3D高斯原语以实现高保真重建,导致显著的内存消耗。...常见的方法是使用当前观测的稀疏射线采样训练网络,同时重放历史数据中的关键帧。然而,在大规模增量建图中,这种策略导致数据累积增加,需要复杂的重新采样程序以提高内存效率。遗忘问题也扩展到基于网格的方法。...对于这两种方法,由于潜在特征网格缺乏灵活性以适应闭环校正的位姿校正,计算成本大大增加。实际上,这需要在校正闭环并更新位姿后重新分配特征网格并重新训练整个地图。...通过结构化的分类和分析,突出显示了关键的局限性和创新,提供了在跟踪、建图和渲染方面的比较结果和宝贵见解。同时它还识别了当前的开放挑战,为未来的研究提供了有趣的探索方向。

    1.4K11

    深度学习3D合成

    因此,考虑到上述问题,一个多边形网格看起来更真实,相比其他格式表示可以更好的合成。 ? 多边形网格表示 在本文中,我们将讨论三种方法,它们可以用来从 2D 数据中合成 3D 数据。...然而,大多数输出点对应于无意义的非曲面点,而且这种离散化限制了输出表示的分辨率。...UV 空间和 UV 位置图被研究人员频繁地用于计算机图形学空间领域,将 3D 空间参数化为 2D 图像平面。...网格形变网络的图卷积网络由三个变形块和两个中间图上池化层组成。变形块逐步处理网格模型的输入图,而中间图上池化层逐步增加图顶点,以增加图的信息容纳能力,同时保持数据的三角形网格形成。...该 transformer 利用其高效的信息聚合能力来捕获网格顶点和目标几何中存在的强非局部相关性。

    1.3K21

    Transformer变革3D建模,MeshGPT生成效果惊动专业建模师,网友:革命性idea

    遗憾的是,这样做的结果是网格密度过高、网格划分过细,经常出现过度平滑和等值曲面化带来的凹凸不平的错误,如下图所示: 相比之下,3D 建模专业人员建模的 3D 网格在表示上更加紧凑,同时以更少的三角形保持了清晰的细节...在 ShapeNet 数据集上进行的多个类别的实验表明,与现有技术相比,MeshGPT 显著提高了生成 3D 网格的质量,形状覆盖率平均提高了 9%,FID 分数提高了 30 个点。...这位评论者表示,下一步可能是由 LLM 控制 3D 种子的生成,并将图像模型添加到架构的自回归部分。走到这一步后,游戏等场景的 3D 资产制作才能实现大规模的自动化。...该研究使用 Transformer 从预先学习的 codebook 词汇中生成网格序列作为 token 索引。在训练过程中,图形编码器会从网格面提取特征,并将其量化为一组面嵌入。...,将 3D 网格表征为多个 2D 平面的变形。

    53410

    EMNLP2023!蚂蚁 && 复旦 | 提出全新多模态文档信息抽取模型

    因此,对视觉富文档的结构化分析和信息抽取是企业生产中的必要一环,自动化地从视觉富文档中提取关键信息,是企业数字化服务的一项关键性技术。...EL 任务旨在基于某种预定义的实体关系,在文档中找到所有符合条件的实体对。通过 EL 识别出的实体对具有显式语义,可用于构建结构化知识图谱,用于增强对文档内容的语义理解。...以此法,我们将每条文档样本的实体标注表示为 E*N*N 的二值网格标签。 随后,我们建立模型进行网格标签的预测。...通过上述方式,EL 和 ROP 任务均可转化为网格标签预测的任务范式,从而能使用 TPP 进行解决。...▲ 图6: (左)FUNSD数据集的原始标注;(右)我们的重新标注,更符合现实应用场景。

    1.7K10

    数字文艺复兴来了:英伟达造出「AI版」米开朗基罗,实现高保真3D重建

    创意专业人士可以将这些 3D 对象导入到设计应用中,进一步编辑它们来创造艺术作品、开发视频游戏、创造机器人和产业数字人应用。...因此,优化更新只会传递给局部哈希网格,缺乏非局部的平滑性。针对这种局部性问题,英伟达提出了一种简单的补救方案:使用数值梯度。图 2 给出了该方法的概况。...在实践中,英伟达的做法是先将步长初始化为最粗的哈希网格大小,然后在整个优化过程中指数级地降低步长以匹配不同的哈希网格大小。...哈希网格分辨率:如果从优化一开始,所有哈希网格都被激活,为了捕获几何细节,细粒度哈希网格就必须首先「忘记」粗粒度优化(更大步长)所学到的东西,并用更小的步长「重新学习」。...因此,一开始只会激活一组初始的粗粒度哈希网格,当步长缩小至其空间大小时,会在优化过程中渐进式地激活更细的哈希网格。这样一来,就能避免「重新学习」过程,从而更好地捕获细节。

    21630

    基于三维卷积神经网络的点云标记

    另一方面,简单地将3D数据投影到诸如深度图像之类的2D表示,然后应用2D技术很容易导致3D表示中嵌入的重要结构信息丢失。灵感来自于对二维图像问题的成功深入学习。...然后将推断的标签映射回原始点云,以生成点标记结果(第六节) 需要注意的是,由于训练和测试模块的不同要求,除了网格大小和体素数等参数外,体素化过程是非常不同的。我们将在第四节讨论体素化的细节。 ?...四 体素化 我们通过以下过程将点云转化为三维体素。我们首先计算全点云的边界框。然后,我们描述了如果选择点云的中心点,如何保持局部体素化。...使细胞的大小与构建体素网格的细胞相同。在大多数情况下,一个单元格中存在多个类别的点。采用投票的方式来决定细胞的标签,即细胞内点数最多的类别将被视为细胞的代表性类别。...B.三维池化层 一个3d池化层可以表示为P(n,g),即输入大小为n×n×n的池层和一个池内核g×g×g,我们使用3d 最大池化。

    2.4K30

    单图像三维重建、2D到3D风格迁移和3D DeepDream

    点云存在纹理和照明难以应用的问题,因为点云没有表面。多边形网格由一系列顶点和表面组成,因此它们是可伸缩的,并且有面,进而作者采用了这种方式。...然而,由于多边形网格的数据结构是一个复杂的图形,很难集成到神经网络中。...为了生成这个对象,物体空间中的顶点No被转化为屏幕空间中的顶点Ns,这个顶点Ns是一个二维向量。 通过采样从屏幕空间的顶点Ns和面F生成图像,这个过程叫做光栅化。下图说明了单个图像的光栅化: ?...2D到3D的风格迁移:在本节中,作者提出了一种将图像Xs的样式传输到网格Mc上的方法。对于二维图像,风格迁移是通过同时最小化内容损失和风格损失来实现的。在这里,作者把内容指定为三维网格Mc。...为了使生成的网格形状与Mc相似,假设两个网格的顶点到面的关系相同,我们重新定义了如下内容损失函数: ? 作者使用了与2D应用中相同的风格损失,如下所示: ?

    1.7K31

    视频数据训练太慢?试试UT-Austin&FAIR提出的多重网格训练,加速4.5倍,还能提点!

    此外,多重网格训练方法适用于多种模型、数据集、初始化和硬件规模。 作者观察到,在所有情况下,在不进行调参的情况下,都能获得一致的加速比和性能增益。...作者将通过实验研究两个问题:1) 是否有一组具有网格schedule的网格可以在不损失精度的情况下实现更快的训练?2)如果是,它是否能够在不进行修改的情况下有力地推广到新模型和数据集? 3.1....首先,在不同网格上重新采样数据需要合适的运算。对于视频,该运算可以是应用于源离散信号的重建滤波器,然后计算网格指定点处的值(例如双线性插值)。...其次,模型必须与在不同网格上重新采样的输入兼容,因此在训练期间可能具有不同的形状。...由在重采样的维度上使用权重共享的函数组成的模型是兼容的,本文方法涵盖了大多数常用的结构,例如2D和3D卷积、RNN和自注意力。在本文中,作者主要关注2D,3D卷积和self-attention。

    1K11

    ECCV2020 | Gen-LaneNet:百度Apollo提出两阶段的3D车道线检测算法,已开源

    3D LaneNet可能需要成倍增加的训练数据量,以便在存在部分遮挡、变化的照明或天气条件下产生相同的3D几何体。标记3D车道要比标记2D车道贵得多。...该方法基于半局部BEV(鸟瞰视角)的网格表示形式,其将车道线分解为简单车道线段。该方法结合了线段学习的参数化模型和聚类线段成为全车道线的深度特征嵌入。...该方法适用于“鸟瞰视角(Bird Eye View)”透视图,该视图被栅格化为粗网格。输出所有网格的参数化3-D曲线表示,然后处理形成整个3-D车道曲线以及检测的不确定性估计。 ?...投影应用相机俯仰角ϕ和高度h定义的单应变换(homography),将图像平面映射到道路平面,如图所示。最终BEV特征图在空间上分为由W×H个非重叠网格组成的网格G。...Anchor representation的本质其实是利用网络实现结构化场景中边界检测和轮廓分组。

    2.2K30

    南洋理工 & 清华 & 伦敦帝国 & 西湖大学开源 MeshAnything V2 | AMT 技术提升网格生成性能和效率 !

    ., 2020)通过训练生成器和判别器网络来产生合成3D数据,从而区分生成数据和真实数据。最近,一些新领域的工作直接以前馈方式生成3D资产。...作者首先概述了先前的方法中使用的分词方法。尽管在细节上存在差异,但先前的分词方法可以归并为以下形式:给定一个网格,先按其z-y-x坐标对顶点进行升序排序,其中z表示垂直轴。...当没有相邻面可用时,如图2 的最后一步所示,AMT 在序列中插入特殊标记“&”以表示这一事件,并从尚未编码的面开始重新启动过程。(3) 为了反编码,只需按照算法 1 描述的逆向进行标记化算法即可。...如4.3节所示,在Obiayverse测试集中,AMT平均可以将的长度缩短一半。 网格标记化中的排序讨论。先前的方法和AMT最初对网格的顶点和面进行排序。...作者从数据集中随机抽取10k个网格样本,这些样本具有少于1600个面,并使用先前的标记化方法和AMT分别对它们进行标记序列的分词。

    17810

    ICML 2024 | 基于体素网格的药物设计

    作者的方法将分子表示为3D原子密度网格,并利用3D体素去噪网络进行学习和生成。...SBDD生成模型通常将分子表示为离散的体素网格或原子点云。基于体素的方法将原子(或电子密度)表示为连续的密度,并将分子表示为3D空间的体素网格离散化(体素是体积的离散单位)。...在这两种数据表示选择之间存在明显的权衡。一方面,GNN可以比在体素上操作的架构更容易利用SE(3)等变归纳偏置。另一方面,由于消息传递的形式主义,它们被认为不那么具表现力。...这些模型的表现力可以通过更高阶的消息传递方案来提高。然而,它们需要额外的计算成本,并且尚未应用于3D生成模型。最近,实验证明,非等变但更具表现力的模型在计算机视觉到分子生成的不同领域中与等变模型竞争。...模型方法 为了体素化分子,作者将原子表示为3D空间中的球形密度,其密度随到原子中心的平方距离呈指数衰减。通过将原子周围的空间离散化为体素网格来创建体素化分子,每个体素的值表示原子的占据情况。

    13610

    一秒内从单个图像生成3D对象,支持实时编辑,Stability AI推出3D生成新方法SPAR3D

    这个系统将 3D 重建过程分为点采样和网格化两个阶段,实现了高效率与高质量的平衡。...在网格化阶段,系统通过回归方法将采样得到的点云转换为高细节网格,并利用局部图像特征确保与输入图像的准确匹配。 这种设计将复杂的不确定性计算集中在点采样阶段,让网格化阶段能够专注于生成高质量的细节。...当 3D 生成的结果与用户期望不符时,可以在低分辨率点云上轻松进行局部编辑,无需担心拓扑结构。将编辑后的点云输入网格化阶段即可生成更符合用户需求的网格。...3D 资产虽然在背面保留了较多细节,但存在明显伪影;而纯生成方法(如 Shap-E、LN3Diff)虽然能生成清晰的表面轮廓,但细节经常出错。...他们将 SPAR3D 简化为纯回归模型 SPAR3D w/o Point(移除点采样阶段),并在 GSO 和 Omniobject3D 数据集上进行对比。

    5510

    【独家】一文读懂聚类算法

    2.1 层次化聚类算法 又称树聚类算法,透过一种层次架构方式,反复将数据进行分裂或聚合。...算法流程: 将每个对象看作一类,计算两两之间的最小距离; 将距离最小的两个类合并成一个新类; 重新计算新类与所有类之间的距离; 重复1、2,直到所有类最后合并成一类。...2.5 基于网格的聚类算法 基于网格的方法把对象空间量化为有限数目的单元,形成一个网格结构。所有的聚类操作都在这个网格结构(即量化空间)上进行。...数据派研究部介绍 数据派研究部成立于2017年初,志于打造一流的结构化知识分享平台、活跃的数据科学爱好者社群,致力于传播数据思维、提升数据能力、探索数据价值、实现产学研结合!...研究部的逻辑在于知识结构化、实践出真知:梳理打造结构化基础知识网络;原创手把手教以及实践经验等文章;形成专业兴趣社群,交流学习、组队实践、追踪前沿。

    2.6K80

    立体相机开发|几何感知的实例分割

    建立了一个两级检测器的骨干网络,如ResNet50-FPN,和一个区域建议网络(RPN)的非最大抑制。通过将立体图像输入主干网和RPN来收集目标。...利用back-projecting 2d网格结构化数据到三维点云处理点云网络,back-project差异映射到R3空间,第一和第二组件描述其2d网格坐标,第三个组件存储其差异值,将这种表现称为3D ROI...实例分割网络 每个3D ROI包含不同数量的点。为了便于训练,将三维感兴趣区域统一采样到1024个点,并将所有的三维感兴趣区域收集为张量。...开发一个点网结构的实例分割网络来提取点特征并进行匹配掩码概率预测。将3D特征重新投影到2D网格中,以计算预测及其损失。由于在基于点云的实例分割中没有打破点的顺序,因此该投影是有效的。...通过最小化损失,不同表达语句的网络之间可以相互监督,从而提取更多的描述性特征用于掩模回归,从而在M 2.5D和M 3D之间形成相似的概率分布。

    43620

    智驾车技术栈 | 综述:自动驾驶中基于深度学习的LiDAR点云综述研究

    然而,自动处理不均匀、非结构化、噪声和海量的3D点云仍是一项具有挑战性和乏味的任务。...(2)基于体素的网络:在基于体素的网络中,点云首先被体素化为网格,然后从这些网格中学习特征。最后构建深度网络,将这些特征映射到分割掩膜。...(2)从常规体素网格进行3D目标检测(定位) 为了更好地利用CNNs,一些方法将3D空间体素化为体素网格,用标量值表示,如从体素中提取的占用或向量数据。...表5 3D汽车定位性能在KITTI benchmark的表现,指标:平均精度(APloc[%]) / 5.3 3D目标分类 / 在非结构化和不受控制的现实环境中,目标分类(识别)对安全可靠驾驶来说至关重要...(2)鲁棒的数据表示:非结构化和无序的数据格式对鲁棒的3D深度学习架构提出了巨大的挑战。

    1.3K10
    领券