首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

关系推理水平超越人类:DeepMind展示全新神经网络推理预测技术

具备 RN 模块神经网络具有处理非结构化输入能力(如一张图片或一组语句),同时推理出事物其后隐藏关系。 使用 RN 网络可以处理桌子各种形状(球体、立方体等)物体组成场景。...大约 150 内,VIN 预测近似于真值模拟。之后虽然有所不同,但依然能产生看上去合理动态预测。 VIN 包括两种机制:视觉模块和物理推理模块。...二者结合能够将视觉场景处理成一系列有区别的物体,并学习物理规则一套隐式系统,从而预测未来物体会发生什么。 研究人员多种系统中测试了 VIN 能力,包括桌球撞击、行星系统引力关系等。...而其动态预测器则可以通过计算它们交互和动态来这些状态未来情况,从而预测出一个任意长度物理轨迹。...我们发现,仅需要 6 个输入视频,该视觉交互网络就可以生成精准未来轨迹,且这些轨迹时间步数都是数以百计,可涵盖大量物理系统。

62860

DeepMind AI 关系推理超越人类:深度神经网络模块即插即用

连续大约 150 视频中,VIN 给出了极为接近模拟,这之后预测结果从肉眼看来也算是合理。...结合在一起,VIN 两大模块能够处理一段视觉场景,并且预测其中每个不同物体现实物理规律下会发生情况。...作者摘要中写道,只需一眼,人类便能对一系列不同物理系统未来状态做出各种各样预测。...动态预测器则通过计算物体之间相互作用和力学关系,学习将这些状态向前推进,从而产生任意长度预测物理轨迹。 ?...作者发现,只有 6 输入视频情况下,VIN 可以生成各种物理系统中几百个时间步长预测轨迹,而且这些轨迹都是准确

1.2K140
您找到你想要的搜索结果了吗?
是的
没有找到

使用单一卷积网实时进行端到端3D检测,跟踪和运动预测

Alahi等人[1]使用LSTMs对行人之间相互作用进行建模,并进行相应预测。Ma等人[19]提出利用博弈论概念来模拟行人之间相互作用,同时预测未来轨迹。...一些工作也集中动态物体短期预测[7,22]。[28]使用可变自动编码器[26,20]对密集像素级短期轨迹进行预测,该编码器聚焦于预测视频未来,而无需显式地推理每像素运动。...为了实现这一目标,我们开发了一种级检测器,它以多为输入,对未来物体运动轨迹进行检测、跟踪和短期运动预测。我们输入表示是一个4D张量,它在多个时间对3D空间占用网格进行编码。...我们将读者引用到图4中,了解我们架构。 然后我们添加两个卷积层分支,如图5所示。第一个执行二元分类预测作为车辆概率。第二个预测当前边界框以及未来n-1。...此外,增加预测损失仅在当前提供类似的检测结果,但是,它使我们能够解码轨迹并提供输出更平滑检测证据,从而提供最佳性能,即在IoU 0.7mAP比检测器好6%个点。 ?

96920

自动驾驶关键环节:行人行为意图建模和预测()

如图是预测结果展示。模拟场景有障碍物,还有有21人7个群行走,开始目标放置地图4个角。 • 左:人初始位置用彩色圆圈显示,每种颜色对应一组。...如图所示,SoPhie预测社会性和物理性似乎合理轨迹。 为此,该方法结合场景所有代理影响以及场景上下文。 ? 下面分析SoPhie细节。...注意模块由两个注意机制组成,分别称为社交和物理注意组件。物理注意力从训练数据中了解场景空间(物理)约束,并专注于每个代理物理上可行未来路径。...最后是一些结果图:SoPhie物理和社会注意力正确预测并修复Social GAN错误三个示例场景。在所有图将过去和预测轨迹分别绘制为线和分布。其中白色突出显示物理注意力机制权重图。...假设模型学习轨迹表示比空间局部代理能够更有效地推断周围代理重要性。为了模拟人-人交互,不需独立预测每个人未来位置;相反,多个人之间联合推理并耦合彼此预测捕获之间交互。

1.8K20

生成图像动力学:Generative Image Dynamics

该模型是根据从大量真实视频序列中自动提取运动轨迹进行训练输入图像条件下,模型会预测出神经随机运动纹理,用于描述每个像素未来运动轨迹。...由此产生频率空间纹理可以转化为密集长距离像素运动轨迹,这些轨迹可用于合成未来,将静态图像转化为逼真的动画。...为了避免预测庞大输出表示,许多先前动画制作方法要么自动生成视频,要么通过额外时间嵌入独立预测每个未来输出。...然而,这两种方法都不能确保生成视频时间长期一致性,而且都会生成随时间漂移或偏离视频。...另一种方法是通过向 LDM 注入额外频率嵌入,每个频率独立预测运动频谱图,但这会导致频域预测不相关,从而导致不切实际运动。

1.4K40

Unsupervised Learning of Latent Physical Properties Using

1简介 物体物理特性与物理定律相结合,决定了物体我们世界中移动和相互作用方式。为我们观察对象分配属性有助于我们总结我们对这些对象理解,并更好地预测他们未来行为。...PPN由以下两个部分组成: 所述感知网络作为输入对象运动序列短观察窗。它为场景每个对象输出属性向量,该对象编码该对象相关潜在物理属性。...每个输入是一组状态向量,由每个对象位置和瞬时速度组成。训练期间,没有给出属性向量直接监督目标。 该预测网络使用由感知网络生成从不同起始构型模拟对象属性向量。...第一球质量保持固定为1,而第二个质量是从11个值范围从选择 32 - 1 至 32 ,对数标度均匀间隔。我们弹簧域执行类似的实验,使用与第二个对象弹簧电荷相同11个值。...每个数据集 120 fps 进行采样。 我们弹跳球数据集创建中,我们使用拒绝采样来过滤掉模拟,其中一些物体潜在属性不能从观察推断出来。

92730

一拖一拽,玫瑰复活了!谷歌提出生成图像动力学,从此万物皆有灵

是根据从大量真实视频序列中自动提取运动轨迹,来进行模型训练。 输入图像为条件,训练后模型预测「神经随机运动纹理」:一组运动基础系数,用于描述每个像素未来轨迹。...为了避免预测如此大输出表示,许多先前动画方法要么自回归地生成视频,要么通过额外时间嵌入独立预测每个未来输出。...为了解决上述问题,研究人员频率域中表示输入场景每像素运动纹理(即所有像素完整运动轨迹),并将运动预测问题表述为一种多模态图像到图像转换任务。...首先,研究人员使用逆时域FFT(快速傅里叶变换)每个像素点p处计算运动轨迹场 这些运动轨迹场决定了每一个输入像素未来每一个时间步长位置。...这使得研究人员将物体物理响应图像空间二维运动位移场写为傅里叶谱系数与每个模拟时间步骤t复模态坐标,以及时间t加权和。

32260

做自动驾驶涉及哪些技术?超全总结上线

为了模拟社会互动,作者需要了解Agent人及其周围环境动态,预测他们未来行为并防止任何崩溃。 规划决定将车辆带到目的地,同时避开障碍物,从而生成参考路径或轨迹。...03 轨迹预测 为了安排安全高效导航,自动驾驶汽车应该考虑周围其他智能体未来轨迹轨迹预测是一项极具挑战性任务,最近引起了很多关注,它可以预测场景中所有动态智能体的当前和过去状态。...第二部分是“轨迹”,它需要预测Agent接下来N个未来一组可能未来位置,称为路点。这建立了他们与其他Agent以及道路互动。...HERE语义图一个有用特征是,它们通过定义数据子集来实现特定驾驶场景模型训练和评估。 基本E2E驾驶模型采用一系列过去图像(例如,最后K)和地图渲染,并预测未来时间步长转向角和速度。...基于数字孪生方法旨在使用来自传感器和物理模型数据,模拟环境中构建真实世界物理实体地图,实现反映相应物理实体(如AR(增强现实)和MR(混合现实))整个生命周期过程作用。

84880

AI哥白尼诞生!不仅发现日心说,还有望解决量子力学矛盾

但是,神经网络不是像物理学家那样将信息提炼成几个易于解释规则,而是一个黑匣子,不可预测且难以解释方式将其获得知识分布成千上万个节点。...因此,Renner团队设计了一种“整体化”神经网络:两个子网仅通过少数几个链接就可以相互连接了。第一个子网络将像典型神经网络一样从数据中学习,第二个子网络将利用该学习成果来进行和检验新预测。...最初测试之一是给网络提供有关从地球看火星和太阳天空中运动模拟数据。从这个角度来看,火星绕日轨道似乎是不稳定,例如它会周期性地“逆行”,从而逆转其方向。...几个世纪前,天文学家一直认为地球处于宇宙中心,并通过行星天空中称为行星小圆圈运动来解释火星运动。...加拿大多伦多大学物理学家马里奥·克伦(Mario Krenn)说,该团队神经网络提出了哥白尼式火星轨迹公式,重新发现了“科学史上最重要转变之一”。 ?

43730

给GNN一堆数据,它自己发现了万有引力定律

机器学习 (ML) 推动了科学巨大进步,从粒子物理学到结构生物学再到宇宙学,机器学习能够大型数据集中学习特征,对不同对象进行分类,并执行参数推断,以及更具开创性应用,例如自回归语言模型、预测蛋白质结构...论文作者之一 Miles Cranmer 推特截图 具体而言,该研究提出了一种采用机器学习方法,通过观察自动发现实际物理系统控制方程和隐藏属性。...研究者训练了一个图神经网络,通过 30 年轨迹数据来模拟太阳系太阳、行星和大型卫星动力学。...在这里,太阳系太阳、行星和卫星(相对)位置和速度被表示为输入图节点,而天体之间可能物理交互(例如力)被表示为图边。该研究将基于 GN 模拟器与 30 年来观测到太阳系轨迹进行了拟合。...对于像 Phoebe、Hyperion 和 Nereid 这样天体,由于它们是非常小卫星,对其他天体轨迹影响可以忽略不计。因此,只要它们质量很小就不会任何方式影响系统。

32520

7 Papers & Radios | DeepMind用AI复原古希腊铭文登Nature封面;GPU调优GPT-3超参数

具体而言,该研究提出了一种采用机器学习方法,通过观察自动发现实际物理系统控制方程和隐藏属性。研究者训练了一个图神经网络,通过 30 年轨迹数据来模拟太阳系太阳、行星和大型卫星动力学。...在这里,太阳系太阳、行星和卫星(相对)位置和速度被表示为输入图节点,而天体之间可能物理交互(例如力)被表示为图边。该研究将基于 GN 模拟器与 30 年来观测到太阳系轨迹进行了拟合。...首先使用标准 Transformer 文本编码器从文本查询中提取语言特征,使用时空编码器从视频中提取视觉特征。接着将这些特征传递给多模态 Transformer 输出几个对象预测序列。...GBRT 输入设置可以时间序列预测领域提高 ARIMA 和原版 GBRT 等精心配置模型所产生预测性能; 三,研究者比较了 GBRT 与各种 SOTA 深度学习时间序列预测模型性能,并验证了它在变量和双变量时间序列预测任务中竞争力...本文中,研究者们 X 光安检场景为例,首先从域间偏移产生原因入手,结合常见自然场景变化,分析外生和内生域间偏移异同点。

28120

Nat. Commun. | AI语言工具揭示分子运动

最近,LSTMs还被证明有可能模仿实验或模拟产生轨迹获得大量过去数据情况下,对未来短时间内做出准确预测。...这项工作中,研究人员考虑了RNNs,特别是LSTMs另一种可以说是新颖用途,进行预测时,与以前工作相比,这些预测很长一段时间内都是有效,但只是统计意义。...尽管只短时间内有效,这里研究人员感兴趣是来自化学和生物物理问题,其中强调是更多统计上有效预测极长时间内有效。...通过使用一个字符级语言模型,有效地预测未来字符,给定序列中迄今为止字符,可以学习被映射到字符中MD轨迹演变。...3.7 从分子力谱轨迹学习 研究人员使用LSTM模型从10.9 pN恒定力进行多态核糖开关分子力谱实验中学习。

40050

AI重回16世纪变身哥白尼!重新推导“日心说”,还将助力解决量子力学矛盾

也就是说,让机器自学哥白尼时代基础物理知识和相关轨道运行信息,它能够自行得出“太阳中心说”结论,甚至还自行推出了哥白尼提出火星运动轨迹公式。...这一发现堪称人类科学史上“高光时刻”之一,不仅在天文学上,历史、宗教领域都带来了不可超越重大影响。 据nature报道,这一人类花了几个世纪才弄清楚行星运转规律, 也可以被算法短时间模拟。...但是,神经网络无法自动将这些信息提炼成几个易于解释规则,它是一个黑匣子,一种无法预测且难以解释方式,将其获得知识分布成千上万个结点。...他认为,这些技术是我们理解并跟上物理学中其他更复杂现象希望。 Renner团队希望开发机器学习技术,帮助物理学家解决目前存在量子力学矛盾。...神经网络准确地预测了三体运动,并正确模拟出相近轨迹散度,与Brutus方法计算结果极其相近。

54110

如何从第一原理建模具身机器人

首先,生物体不会维持关于世界事态静态假设,但也可以构建内部动态 无论是瞬时轨迹还是未来状态 使其能够预测不同时间尺度发生事件发展。其次,这些动态假设可以通过运动来实现。...这种层次结构可以推广到参考之间执行⻬次变换,例如透视投影[57]。然而,单独连续模型现实世界中缺乏有效可用性,因为它只能处理当前感官状态,而不能执行任何形式未来规划。...然而,之前所有模拟中,我们只考虑了自由度手臂,而在现实生活中,我们通常处理更复杂运动结构,例如人体。...这种方法也与主动预测编码[104]和递归神经程序[105]有一些类比,它们通过递归地将参考变换应用于场景各个部分来解决计算机视觉中部分‑整体层次结构学习问题。...这些实体中每一个都有自己动力学,允许代理预测例如移动球轨迹。然后,该单元被扩展构建复杂层次结构,例如,用于模拟人体运动学[44],并执行更通用参考系变换,例如透视投影[57]。

6910

机器人建模第一原理

首先,生物体不会维持关于世界事态静态假设,但也可以构建内部动态 无论是瞬时轨迹还是未来状态 使其能够预测不同时间尺度发生事件发展。其次,这些动态假设可以通过运动来实现。...这种层次结构可以推广到参考之间执行⻬次变换,例如透视投影[57]。然而,单独连续模型现实世界中缺乏有效可用性,因为它只能处理当前感官状态,而不能执行任何形式未来规划。...然而,之前所有模拟中,我们只考虑了自由度手臂,而在现实生活中,我们通常处理更复杂运动结构,例如人体。...这种方法也与主动预测编码[104]和递归神经程序[105]有一些类比,它们通过递归地将参考变换应用于场景各个部分来解决计算机视觉中部分‑整体层次结构学习问题。...这些实体中每一个都有自己动力学,允许代理预测例如移动球轨迹。然后,该单元被扩展构建复杂层次结构,例如,用于模拟人体运动学[44],并执行更通用参考系变换,例如透视投影[57]。

7410

九次架构改进具身机器人,模拟镜像神经元

首先,生物体不会维持关于世界事态静态假设,但也可以构建内部动态 无论是瞬时轨迹还是未来状态 使其能够预测不同时间尺度发生事件发展。其次,这些动态假设可以通过运动来实现。...这种层次结构可以推广到参考之间执行⻬次变换,例如透视投影[57]。然而,单独连续模型现实世界中缺乏有效可用性,因为它只能处理当前感官状态,而不能执行任何形式未来规划。...然而,之前所有模拟中,我们只考虑了自由度手臂,而在现实生活中,我们通常处理更复杂运动结构,例如人体。...这种方法也与主动预测编码[104]和递归神经程序[105]有一些类比,它们通过递归地将参考变换应用于场景各个部分来解决计算机视觉中部分‑整体层次结构学习问题。...这些实体中每一个都有自己动力学,允许代理预测例如移动球轨迹。然后,该单元被扩展构建复杂层次结构,例如,用于模拟人体运动学[44],并执行更通用参考系变换,例如透视投影[57]。

8610

清华、华为等提出iVideoGPT:专攻交互式世界模型

近年来,生成模型取得了显著进展,其中视频生成正在成为一个新前沿领域。这些生成视频模型一个重要应用是,多样化互联网规模数据无监督方式学习,用于构建预测世界模型。...如图 3a 所示,初始上下文 包含丰富上下文信息,通过 N 个 token 独立地进行 token 化和重构: 相比之下,由于上下文未来之间存在时间冗余,只有必要变化信息如移动对象位置和姿态...对于奖励预测,他们没有学习独立奖励预测器,而是每个观察最后一个 token 隐藏状态添加了一个线性头(linear head)。...接下来该研究分析了大规模预训练 iVideoGPT 未见过 BAIR 数据集零样本视频预测能力。...这表明,尽管由于预训练数据多样性不足,模型完全未见过机器人零样本泛化能力有限,但它有效地将场景上下文与运动动态分离开来。

11610

从特斯拉到英伟达,那些端到端自动驾驶研发系统有何不同?

从大规模视频中学习 E2E 驾驶模型 目的是学习一种通用车辆运动模型,而这个端到端训练架构学会从目相机数据预测今后车辆运动分布。如图应用一个FCN-LSTM 结构做到这种运动轨迹预测。...这种通用模型,输入像素,还有车辆历史状态和当今状态,预测未来运动似然函数,其定义为一组车辆动作或者运动粒度(离散和连续)。...命令和图像等测试数据一起作为输入,可以用指向任务向量取代命令构成任务条件模拟学习。 第二个:分支。命令作为一个开关在专用子模块之间切换。...物理系统: 虚拟和实际环境: 自动驾驶失败预测 驾驶模型交通繁忙地区、复杂路口、糟糕天气和照明条件下很可能失败。...如图给出传感器数据进入NN模型之前预处理流水线框图,需要时间同步,空间对齐。

86120

仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟

行人移动模拟特定场景中微观模拟大量人员移动过程,主要关注群体交互对人群移动影响。...早期研究方法尝试社会物理研究领域,基于物理规则模型来解释行人运动背后机制,进而从异质特性背后抽离出行人运动本质特征,例如社会力模型。这些方法存在模拟轨迹不够真实自然问题。...因此,将这种知识融入去噪中间过程中含噪数据操作是困难。 同时,行人移动模拟涉及多个行人和多个时间数据生成任务。现有的方法通常利用扩散模型,一次性生成整个序列。...然而,本工作问题中,一次性生成整个模拟轨迹无法每个时间对每个行人结合社会力模型进行有效引导。 此外,由于生成数据高维性质,一次性生成可能会遇到效率和有效性问题。...提出扩散模型利用图节点和边信息、历史状态和行人终点信息作为条件输入,并利用扩散模型采样行人未来加速度在下一个时间分布,进而更新下一时刻所有行人状态。迭代这一过程即可实现任意时长行为模拟

10410

一文尽览 | 轨迹预测二十年发展全面回顾!

单模态轨迹预测方法输出单个或多个交通参与者未来轨迹;多模态轨迹预测方法利用每个未来轨迹概率为交通参与者生成多模态未来轨迹;交互:预测方法输出行为意图帮助预测。...2.4 蒙特卡洛方法通常,没有任何线性或模型高斯性质假设情况下,预测状态分布解析表达式通常是未知。蒙特卡罗方法可以近似模拟状态分布。它随机采样输入变量,并应用物理模型生成潜在未来轨迹。...Holger等人[52]使用转向角和全局坐标作为HMM输入来预测驾驶员操作。基于HMM,乔等人[53]提出了一种称为HMTP*算法,该算法自适应地选择参数,动态变化速度模拟真实场景。...基于SGAN,Yang等人[148]设计了行人轨迹预测模型,重点关注如何更有效地提取交互相关因素并生成各种可行轨迹,该模型SGAN基础添加了潜在变量预测估计潜在变量。...5)建立基准:需要一个基准,更复杂环境中使用标准统一度量和地图可用数据集。该基准应允许使用避障场景和非凸约束进行长期和多模态预测,并允许使用不同历史范围预测不同预测范围未来轨迹

2.4K20
领券