首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于GAN的单目图像3D物体重建(纹理和形状)

很多机器学习的模型都是在图片上操作,但是忽略了图像其实是3D物体的投影,这个过程叫做渲染。能够使模型理解图片信息可能是生成的关键,但是由于光栅化涉及离散任务操作,渲染过程不是可微的,因此不适用与基于梯度的学习方法。这篇文章提出了DIR-B这个框架,允许图片中的所有像素点的梯度进行分析计算。方法的关键在于把前景光栅化当做局部属性的加权插值,背景光栅化作为基于距离的全局几何的聚合。通过不同的光照模型,这个方法能够对顶点位置、颜色、光照方向等达到很好的优化。此项目有两个主要特点:单图像3D物体预测和3D纹理图像生成,这些都是基于2D监督进行训练的。

01
您找到你想要的搜索结果了吗?
是的
没有找到

注视眼动的控制和功能

人类和其他物种通过每秒两到三次的快速眼球运动(扫视)来探索视觉场景。虽然在扫视的短暂间隔中,眼睛可能看起来不动,但在快速照相机下可以观察到眼球运动始终存在,甚至当观察者注视一个单一点时也是如此。这些运动发生在获取和处理视觉信息的特定时期,它们的功能一直是争论不休的话题。最近在控制正常眼动活动期间的视网膜刺激方面的技术进展,已经阐明了注视眼动的视觉贡献以及这些运动可以被控制的程度。在本文中回顾的大量证据表明,注视眼动是视觉系统处理精细空间细节策略的重要组成部分;它们既能精确定位视网膜上的刺激,又能将空间信息编码到关节的时空域中。本文发表在Annual Review of Vision Science杂志。

01
领券