首页
学习
活动
专区
工具
TVP
发布

相约机器人

专栏成员
664
文章
1096075
阅读量
52
订阅数
Salesforce AI Research Propose 'ALPRO':一种新的视频和语言表示学习(预训练)框架
本文是 Marktechpost 工作人员根据研究论文“对齐和提示:使用实体提示进行视频和语言预训练”的总结。这项研究的所有功劳归于该项目的研究人员。
代码医生工作室
2022-06-07
5740
gDNA:一种 3D 穿衣人体生成模型
快速生成各种高质量虚拟人并完全控制其位置的能力在电影制作、游戏、虚拟现实/增强现实、建筑和计算机视觉中有许多应用。现代计算机图形技术实现了逼真的效果,但它们通常需要大量的专业知识。
代码医生工作室
2022-06-07
9120
KAIST 研究人员提出 DIGAN:一种基于隐式神经表示 (INR) 的生成对抗网络 (GAN),用于使用机器学习生成视频
深度生成模型已经在包括图像和音频在内的各个领域产生了逼真的样本。视频生成最近已成为深度生成模型的下一个问题,引发了对学习视频分发的长期研究。
代码医生工作室
2022-04-14
1.7K0
Google AI 的“TokenLearner”可以提高 Vision Transformer 的效率和准确性
Transformer 模型始终如一地获得最先进的计算机视觉任务,包括对象检测和视频分类。在标准卷积方法中,图像是逐像素处理的。为了获得视觉标记,该方法使用手工设计的分割算法。它需要处理大量密集采样的补丁。
代码医生工作室
2021-12-15
9850
MetaFormer 用于计算机视觉任务的派生模型
过去几年深度学习领域的主要炒作绝对是Transformers 。自从在 2017 年发表被超级引用的论文Attention Is All You Need以来,许多研究人员一直在努力改进它们并将其应用于每个可能的领域。虽然最初为 NLP 而生,但人们对应用于视觉的 Transformers 的兴趣呈指数级增长,并且自 ViT 推出以来,许多研究小组已经提出了其架构的不同变体。
代码医生工作室
2021-12-09
6540
Facebook AI 推出可提高 3D 理解力的“3DETR”和不依赖标签的自监督学习机制“DepthContrast”
在当今世界,开发能够理解世界 3D 数据的系统至关重要。例如自动驾驶汽车需要 3D 理解才能移动并避免与物体碰撞。相比之下AR/VR 应用程序可以帮助人们进行日常活动,例如想象沙发是否适合客厅。
代码医生工作室
2021-10-19
8540
NVIDIA AI 为混合现实任务提出了一种新颖的 AI 框架,例如逼真的虚拟对象插入
从单个图像同时估计反照率、法线、深度和 3D 空间变化照明通常具有挑战性。现有方法的问题在于它们被表述为图像到图像的转换,而忽略了场景的 3D 属性。室内场景的 2D 表示不足以捕捉光线在 3D 空间中的移动方式,这并不奇怪。
代码医生工作室
2021-10-19
5290
TensorFlow.js 在您的 Web 浏览器中实时进行 3D 姿势检测
为了更好地了解人体的视频和图像,姿势检测是关键的一步。目前许多人已经在现有模型的支持下尝试了 2D 姿态估计。
代码医生工作室
2021-09-08
1.7K0
DeepMind 开源感知器 IO,一种通用深度学习模型架构,可处理广泛的数据和任务
最近DeepMind 开源了 Perceiver IO——一种通用的深度学习模型架构,可以处理许多不同类型的输入和输出。这种 Transformers 的“插入式”替代品足够强大,可以在不受领域知识限制的情况下超越基线模型。
代码医生工作室
2021-09-08
9120
Apple 的机器学习团队推出“Hypersim”:用于整体室内场景理解的真实感合成数据集
计算机视觉社区一直渴望找到一种方法,让计算机和人类都能够理解室内场景的复杂性。通过交互式模拟环境创建了没有真实标签的逼真合成数据集,推动了对这些环境的整体理解的快速进展。
代码医生工作室
2021-08-10
1.2K0
用动画在老黄的厨房搞小动作?「AI Tuber」除了配音还能编曲?这次除了显卡都是干货
英伟达终于发布了GeForce RTX 3080 Ti,然而这一点儿都不重要。看完之后发现明显是那个「AITuber」旁白更有意思,是真的可爱!
代码医生工作室
2021-06-15
7870
OpenAI引入了DALL·E:一种通过文本描述创建图像的神经网络
OpenAI最近训练了一个名为DALL·E的神经网络,该神经网络通过文本描述为自然语言可表达的各种概念创建图像。
代码医生工作室
2021-01-14
1K0
用AI「驯服」人类幼崽:这个奶爸找到了硬核带娃的乐趣
长期以来,「奶爸」+「萌娃」一直是一个不被看好的组合,甚至有人说,「父爱如山体滑坡」。不信的话,以下都是证据:
代码医生工作室
2021-01-14
8610
Nvidia研究人员推出了一种模块化原语,可为基于栅格化的可区分渲染提供高性能的原语操作
可微分渲染是一个新颖的领域,可帮助计算3D对象的梯度并允许它们在图像中传播,而无需3D数据收集和注释。计算机图形学中的渲染生成3D场景,该场景由几何形状,材质,场景光和相机属性定义。渲染是一个复杂的过程。它的区别不能唯一地定义;因此不可能直接集成到神经网络中。可微分渲染(DR)构成了一系列技术,这些技术通过获取渲染过程的有用梯度来解决端到端优化的这种集成问题。
代码医生工作室
2020-11-20
1.8K0
Adobe:没有人比我更懂P图
除了越来越接近美图秀秀的简单操作,这次的Adobe不仅带来了艺术,还带来了富有生活气息的场景建议:
代码医生工作室
2020-11-20
4420
谷歌发布Objectron数据集,推进三维物体几何理解的极限
机器学习(ML)的最新技术已经在许多计算机视觉任务上取得了SOTA的结果,但仅仅是通过在2D照片上训练模型而已。
代码医生工作室
2020-11-20
6880
PyTorch 3D:深入挖掘深度学习
Facebook正在缓解3D深度学习的麻烦,一次解决一个问题。去年它发布了Mesh R-CNN,该系统可以从2D形状渲染3D对象。今年它发布了PyTorch3D。
代码医生工作室
2020-11-13
9870
AI构建「银河系漫游指南」,首次绘制宇宙超详细3D地图
2016年,来自夏威夷大学马诺阿分校天文研究所的天文学家们曾经发布了一份包含30亿个天体的目录,其中包括恒星、星系和类星体(超大质量黑洞的活跃核心)。
代码医生工作室
2020-10-23
8030
「过拟合」也能废物利用了:有人用它高清重建3D物体表面,参数减少99%
有向距离场SDF(signed distance field)是计算机图形学中,常见的一种隐式曲面表示方法。
代码医生工作室
2020-09-28
6710
ECCV 2020 | 这个模型的脑补能力比GAN更强,ETH提出新型超分辨率模型SRFlow
超分辨率是一个不适定问题(ill-posed problem),它允许对给定的低分辨率图像做出多种预测。这一基础事实很大程度上被很多当前最优的深度学习方法所忽略,这些方法将重建和对抗损失结合起来,训练确定性映射(deterministic mapping)。
代码医生工作室
2020-09-14
6220
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档