NeRF & Beyond7.25日报(Dyn-E,CarPatch,TransHuman,LIST,3D-LLM,提示综述)

文章来源：企鹅号 - 继珩的温故知新小本本

NeRF与三维重建相关

Dyn-E: Local Appearance Editing of Dynamic Neural Radiance Fields

https://arxiv.org/abs/2307.12909

浙江大学 CAD&CG

本文提出了一种新的框架，通过操纵训练视频的单帧中的像素来编辑动态 NeRF 的局部外观

CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle Components

https://arxiv.org/abs/2307.12718

摩德纳大学，Prometeia

CarPatch，一种新的车辆综合benchmark数据集。除了用其内在和外在相机参数注释的一组图像之外，还为每个视图生成了相应的深度图和语义分割mask。

TransHuman: A Transformer-based Human Representation for Generalizable Neural Human Rendering

https://arxiv.org/abs/2307.12291

浙江大学、达摩院

本文重点关注可泛化神经人体渲染的任务，该任务从不同角色的多视图视频中训练条件神经辐射场（NeRF）

LIST: Learning Implicitly from Spatial Transformers for Single-View 3D Reconstruction

https://arxiv.org/abs/2307.12194

The University of Texas at Arlington, Arlington

LIST，这是一种新颖的神经架构，它利用局部和全局图像特征从单个图像准确地重建 3D 对象的几何和拓扑结构。

3D+LLM相关

3D-LLM: Injecting the 3D World into Large Language Models

https://arxiv.org/abs/2307.12981

UCLA，上海交通大学，华南理工大学，UIUC，MIT，MIT-IBM Lab

本工作将 3D 世界注入大型语言模型中，并提出全新的 3D-LLM 系列

A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models

https://arxiv.org/abs/2307.12980

牛津大学，慕尼黑大学，Google Research

本文旨在对三种类型的视觉语言模型的prompt engineering前沿研究进行全面的调查：多模态到文本生成模型（例如 Flamingo）、图像-文本匹配模型（例如 CLIP）和文本到图像生成模型（例如stable diffusion）。

今日更新结束

Jason陪你练绝技B站更新地址：https://space.bilibili.com/455056488

NeRF相关工作整理Github repo：https://github.com/yangjiheng/nerf_and_beyond_docs

相关快讯