专栏首页arxiv.org翻译专栏多平面图像的单视图合成(CS CV)
原创

多平面图像的单视图合成(CS CV)

最近在视图合成方面的一项工作是在已知的视点上通过给定两个或更多的输入图像,利用深度学习来生成多平面图像(以相机为中心的分层三维展示)。我们将这种表示方法应用于单视角的视图合成,这是一个更具挑战性的问题,但可能有更广泛的应用。我们的方法直接从单个图像输入中学习预测多平面图像,并引入了尺度不变量视图合成的监督,使我们能够在在线视频上进行训练。我们展示了这种方法适用于几个不同的数据集,它还能额外生成合理的深度图,并能学习实现对背景层中的前景对象边缘后面的内容进行填充。

原文题目:Single-View View Synthesis with Multiplane Images

原文:A recent strand of work in view synthesis uses deep learning to generate multiplane images (a camera-centric, layered 3D representation) given two or more input images at known viewpoints. We apply this representation to single-view view synthesis, a problem which is more challenging but has potentially much wider application. Our method learns to predict a multiplane image directly from a single image input, and we introduce scale-invariant view synthesis for supervision, enabling us to train on online video. We show this approach is applicable to several different datasets, that it additionally generates reasonable depth maps, and that it learns to fill in content behind the edges of foreground objects in background layers.

原文作者:Richard Tucker, Noah Snavely

原文地址:https://arxiv.org/abs/2004.11364

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 用于语义分割的分层多尺度注意力机制 (CS CV)

    多尺度推理常用来提高语义分割的结果。将多个图像尺度通过网络,然后用平均法或最大池化法将结果进行组合。在这项工作中,我们提出了一种基于注意力的方法来结合多尺度预测...

    刘持诚
  • 个性化语法纠错:根据能力水平和 L1 进行调整(CS CL)

    语法纠错 (GEC) 系统在各种软件应用中已变得无处不在,并已开始在某些数据集上接近人类水平的性能。然而,对于如何根据用户的特点(如用户的熟练程度和第一语言)或...

    刘持诚
  • 如果可以的话请纠正我:从纠错和标记中学习(CS CL)

    Sequence-to-sequence 学习涉及到训练数据的信号强度和注释成本之间的权衡。例如,机器翻译数据从成本高昂的由专家生成的翻译数据来实现有监督学习,...

    刘持诚
  • 移动设备HTML5页面布局

    在HTML5标准添加的新元素中,用于常见页面结 构的包括header footer footer nav aside aside article section...

    用户1197315
  • mongod.conf配置文件开启认证 原

    # for documentation of all options, see: #   http://docs.mongodb.org/manual/ref...

    拓荒者
  • 2019年智能家居十大关键词

    AIoT已经成为物联网行业的热词,AI(人工智能)赋能IoT(物联网),智能家居自然也不会放过这个智能化升级的最佳通道。

    刘盼
  • video-to-ascii:在命令行中看视频

    最近GitHub上有个很好玩的项目,叫做video-to-ascii。这是一个简单的python包,可以使用字符作为像素在终端中播放视频。

    小歪
  • 系统游戏运行库DirectX修复工具 v3.8 增强版

    (DirectX Repair)是一款系统级工具软件,简便易用。本程序无需安装,可直接运行。 本程序的主要功能是检测当前系统的DirectX状态,如果发现异常则...

    空木白博客
  • Spring boot学习

    通常建议将应用的main类放到其他类所在包的顶层(root package),并将 @EnableAutoConfiguration 注解到你的mai...

    用户1499526
  • Serverless Python开发实战之极速制作情人节表白页

    抗击疫情,腾讯云在行动。Python 是一种热门的编程语言,Serverless 是近年来迅速兴起的一个技术概念,基于Serverless架构能构建出多种应用场...

    腾讯云大学

扫码关注云+社区

领取腾讯云代金券