相约机器人-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

相约机器人

专栏成员

664

文章

1097367

阅读量

52

订阅数

Salesforce AI Research Propose 'ALPRO'：一种新的视频和语言表示学习（预训练）框架

本文是 Marktechpost 工作人员根据研究论文“对齐和提示：使用实体提示进行视频和语言预训练”的总结。这项研究的所有功劳归于该项目的研究人员。

代码医生工作室

2022-06-07

5760

gDNA：一种 3D 穿衣人体生成模型

图像处理 https 网络安全 github

快速生成各种高质量虚拟人并完全控制其位置的能力在电影制作、游戏、虚拟现实/增强现实、建筑和计算机视觉中有许多应用。现代计算机图形技术实现了逼真的效果，但它们通常需要大量的专业知识。

代码医生工作室

2022-06-07

9150

KAIST 研究人员提出 DIGAN：一种基于隐式神经表示 (INR) 的生成对抗网络 (GAN)，用于使用机器学习生成视频

机器学习神经网络深度学习人工智能图像处理

深度生成模型已经在包括图像和音频在内的各个领域产生了逼真的样本。视频生成最近已成为深度生成模型的下一个问题，引发了对学习视频分发的长期研究。

代码医生工作室

2022-04-14

1.7K0

Google AI 的“TokenLearner”可以提高 Vision Transformer 的效率和准确性

图像处理 https 网络安全

Transformer 模型始终如一地获得最先进的计算机视觉任务，包括对象检测和视频分类。在标准卷积方法中，图像是逐像素处理的。为了获得视觉标记，该方法使用手工设计的分割算法。它需要处理大量密集采样的补丁。

代码医生工作室

2021-12-15

9870

MetaFormer 用于计算机视觉任务的派生模型

https 图像处理网络安全

过去几年深度学习领域的主要炒作绝对是Transformers 。自从在 2017 年发表被超级引用的论文Attention Is All You Need以来，许多研究人员一直在努力改进它们并将其应用于每个可能的领域。虽然最初为 NLP 而生，但人们对应用于视觉的 Transformers 的兴趣呈指数级增长，并且自 ViT 推出以来，许多研究小组已经提出了其架构的不同变体。

代码医生工作室

2021-12-09

6550

Facebook AI 推出可提高 3D 理解力的“3DETR”和不依赖标签的自监督学习机制“DepthContrast”

https 网络安全图像处理

在当今世界，开发能够理解世界 3D 数据的系统至关重要。例如自动驾驶汽车需要 3D 理解才能移动并避免与物体碰撞。相比之下AR/VR 应用程序可以帮助人们进行日常活动，例如想象沙发是否适合客厅。

代码医生工作室

2021-10-19

8550

NVIDIA AI 为混合现实任务提出了一种新颖的 AI 框架，例如逼真的虚拟对象插入

图像处理渲染 https 网络安全

从单个图像同时估计反照率、法线、深度和 3D 空间变化照明通常具有挑战性。现有方法的问题在于它们被表述为图像到图像的转换，而忽略了场景的 3D 属性。室内场景的 2D 表示不足以捕捉光线在 3D 空间中的移动方式，这并不奇怪。

代码医生工作室

2021-10-19

5310

TensorFlow.js 在您的 Web 浏览器中实时进行 3D 姿势检测

图像处理 javascript tensorflow

为了更好地了解人体的视频和图像，姿势检测是关键的一步。目前许多人已经在现有模型的支持下尝试了 2D 姿态估计。

代码医生工作室

2021-09-08

1.7K0

DeepMind 开源感知器 IO，一种通用深度学习模型架构，可处理广泛的数据和任务

深度学习图像处理开源编程算法

最近DeepMind 开源了 Perceiver IO——一种通用的深度学习模型架构，可以处理许多不同类型的输入和输出。这种 Transformers 的“插入式”替代品足够强大，可以在不受领域知识限制的情况下超越基线模型。

代码医生工作室

2021-09-08

9160

Apple 的机器学习团队推出“Hypersim”：用于整体室内场景理解的真实感合成数据集

计算机视觉社区一直渴望找到一种方法，让计算机和人类都能够理解室内场景的复杂性。通过交互式模拟环境创建了没有真实标签的逼真合成数据集，推动了对这些环境的整体理解的快速进展。

代码医生工作室

2021-08-10

1.2K0

用动画在老黄的厨房搞小动作？「AI Tuber」除了配音还能编曲？这次除了显卡都是干货

图像处理游戏

英伟达终于发布了GeForce RTX 3080 Ti，然而这一点儿都不重要。看完之后发现明显是那个「AITuber」旁白更有意思，是真的可爱！

代码医生工作室

2021-06-15

7890

OpenAI引入了DALL·E：一种通过文本描述创建图像的神经网络

神经网络渲染图像处理

OpenAI最近训练了一个名为DALL·E的神经网络，该神经网络通过文本描述为自然语言可表达的各种概念创建图像。

代码医生工作室

2021-01-14

1K0

用AI「驯服」人类幼崽：这个奶爸找到了硬核带娃的乐趣

图像处理 python c++游戏

长期以来，「奶爸」+「萌娃」一直是一个不被看好的组合，甚至有人说，「父爱如山体滑坡」。不信的话，以下都是证据：

代码医生工作室

2021-01-14

8620

Nvidia研究人员推出了一种模块化原语，可为基于栅格化的可区分渲染提供高性能的原语操作

图像处理渲染 https pytorch 网络安全

可微分渲染是一个新颖的领域，可帮助计算3D对象的梯度并允许它们在图像中传播，而无需3D数据收集和注释。计算机图形学中的渲染生成3D场景，该场景由几何形状，材质，场景光和相机属性定义。渲染是一个复杂的过程。它的区别不能唯一地定义；因此不可能直接集成到神经网络中。可微分渲染（DR）构成了一系列技术，这些技术通过获取渲染过程的有用梯度来解决端到端优化的这种集成问题。

代码医生工作室

2020-11-20

1.8K0

Adobe：没有人比我更懂P图

除了越来越接近美图秀秀的简单操作，这次的Adobe不仅带来了艺术，还带来了富有生活气息的场景建议：

代码医生工作室

2020-11-20

4420

谷歌发布Objectron数据集，推进三维物体几何理解的极限

图像处理图像识别机器学习神经网络深度学习

机器学习(ML)的最新技术已经在许多计算机视觉任务上取得了SOTA的结果，但仅仅是通过在2D照片上训练模型而已。

代码医生工作室

2020-11-20

6900

PyTorch 3D：深入挖掘深度学习

图像处理 pytorch 深度学习 python matlab

Facebook正在缓解3D深度学习的麻烦，一次解决一个问题。去年它发布了Mesh R-CNN，该系统可以从2D形状渲染3D对象。今年它发布了PyTorch3D。

代码医生工作室

2020-11-13

9900

AI构建「银河系漫游指南」，首次绘制宇宙超详细3D地图

神经网络机器学习图像处理深度学习人工智能

2016年，来自夏威夷大学马诺阿分校天文研究所的天文学家们曾经发布了一份包含30亿个天体的目录，其中包括恒星、星系和类星体(超大质量黑洞的活跃核心)。

代码医生工作室

2020-10-23

8050

「过拟合」也能废物利用了：有人用它高清重建3D物体表面，参数减少99%

图像处理神经网络

有向距离场SDF（signed distance field）是计算机图形学中，常见的一种隐式曲面表示方法。

代码医生工作室

2020-09-28

6720

ECCV 2020 | 这个模型的脑补能力比GAN更强，ETH提出新型超分辨率模型SRFlow

神经网络机器学习深度学习人工智能图像处理

超分辨率是一个不适定问题（ill-posed problem），它允许对给定的低分辨率图像做出多种预测。这一基础事实很大程度上被很多当前最优的深度学习方法所忽略，这些方法将重建和对抗损失结合起来，训练确定性映射（deterministic mapping）。

代码医生工作室

2020-09-14

6230

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态