首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

NeRF & Beyond7.25日报(Dyn-E,CarPatch,TransHuman,LIST,3D-LLM,提示综述)

NeRF与三维重建相关

Dyn-E: Local Appearance Editing of Dynamic Neural Radiance Fields

https://arxiv.org/abs/2307.12909

浙江大学 CAD&CG

本文提出了一种新的框架,通过操纵训练视频的单帧中的像素来编辑动态 NeRF 的局部外观

CarPatch: A Synthetic Benchmark for Radiance Field Evaluation on Vehicle Components

https://arxiv.org/abs/2307.12718

摩德纳大学,Prometeia

CarPatch,一种新的车辆综合benchmark数据集。除了用其内在和外在相机参数注释的一组图像之外,还为每个视图生成了相应的深度图和语义分割mask。

TransHuman: A Transformer-based Human Representation for Generalizable Neural Human Rendering

https://arxiv.org/abs/2307.12291

浙江大学、达摩院

本文重点关注可泛化神经人体渲染的任务,该任务从不同角色的多视图视频中训练条件神经辐射场(NeRF)

LIST: Learning Implicitly from Spatial Transformers for Single-View 3D Reconstruction

https://arxiv.org/abs/2307.12194

The University of Texas at Arlington, Arlington

LIST,这是一种新颖的神经架构,它利用局部和全局图像特征从单个图像准确地重建 3D 对象的几何和拓扑结构。

3D+LLM相关

3D-LLM: Injecting the 3D World into Large Language Models

https://arxiv.org/abs/2307.12981

UCLA,上海交通大学,华南理工大学,UIUC,MIT,MIT-IBM Lab

本工作将 3D 世界注入大型语言模型中,并提出全新的 3D-LLM 系列

A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models

https://arxiv.org/abs/2307.12980

牛津大学,慕尼黑大学,Google Research

本文旨在对三种类型的视觉语言模型的prompt engineering前沿研究进行全面的调查:多模态到文本生成模型(例如 Flamingo)、图像-文本匹配模型(例如 CLIP)和文本到图像生成模型(例如stable diffusion)。

今日更新结束

Jason陪你练绝技B站更新地址:https://space.bilibili.com/455056488

NeRF相关工作整理Github repo:https://github.com/yangjiheng/nerf_and_beyond_docs

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OVXcpZMjO2XjkcwOoZ_QnG-g0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券