首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

学习用于视觉跟踪的深度紧凑图像表示

在线跟踪涉及分类神经网络,该分类神经网络由训练的自动编码器的编码器部分构成,作为特征提取器和附加分类层。可以进一步调整特征提取器和分类器以适应移动物体的外观变化。...首先,它使用堆叠去噪自动编码器(stacked denoising autoencoder SDAE)来学习大图像数据集中的通用图像特征作为辅助数据,然后将学到的特征传输到在线跟踪任务。...它学会从损坏的版本中恢复数据样本。这样做,学习了鲁棒特征,因为神经网络包含“瓶颈”,其是具有比输入单元更少单元的隐藏层。我们在图1(a)中展示了 DAE 的架构。 让共有k个训练样本。...通过从损坏版本重建输入,DAE 比传统自动编码器更有效地通过阻止自动编码器简单地学习身份映射来发现更强大的特征。 为了进一步增强学习有意义的特征,稀疏性约束被强加于隐藏单元的平均激活值。...当新的视频帧到达时,我们首先根据粒子滤波器方法绘制粒子(一个粒子就是目标可能存在的一块图像,32*32)。然后通过简单的前向传播网络来确定每个粒子的置信度pi。该方法计算量小,精度高。

1.4K52

Methods | CryoDRGN: 利用神经网络重建异质cryo-EM结构

研究人员提出了cryoDRGN,一种使用神经网络从异质单粒子cryo-EM数据集中重建3D密度图的方法。这种方法的强大之处在于它能够表示异构结构,而无需简化关于异构类型的假设。 ?...然而,许多成像的蛋白质复合物表现出构象和组成异质性,这对现有的三维重建方法提出了重大挑战。...研究人员利用深层神经网络的表示能力直接重建3D密度图的连续分布,并绘制单粒子cryo-EM数据集的每粒子异质性。 ?...CryoDRGN包含交互式工具,以可视化数据集的粒子变异性分布,生成密度图以进行探索性分析,提取粒子子集以与其他工具一起使用,并生成轨迹以可视化分子运动。 ?...最后,在分析催化前剪接体时,研究人员发现cryoDRGN重建的连续构象变化缺少基于面罩的多体优化方法19中的刚体边界伪影,或线性模型中的线性插值伪影。

59430
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    每日学术速递1.10

    输入视频帧被调整为224×224大小,并使用CLIP-L/14来提取帧特征。...通过这些步骤,论文不仅提出了一个能够处理LPTEM视频的先进框架,而且还展示了如何利用大规模AI模型来泛化到新的数据集,从而为LPTEM作为单粒子跟踪工具的发展铺平了道路。 论文做了哪些实验?...单粒子轨迹分析: 从分割掩膜数组中计算每个粒子在每帧中的质心位置和方向,并将数据保存为.csv文件。...论文的主要内容: 这篇论文的主要内容包括以下几个方面: 问题陈述: 论文指出了在液相透射电子显微镜(LPTEM)领域中,缺乏一个标准化的框架来识别和跟踪LPTEM视频中的纳米颗粒,这限制了LPTEM技术作为单粒子跟踪工具的发展...方法细节: 论文详细描述了LPTEM实验的设置、数据预处理、模拟视频生成、视频分割、单粒子轨迹分析以及J&F准确度指标评估等实验步骤。

    11910

    深度高能粒子对撞追踪:Kaggle TrackML粒子追踪挑战赛亚军访谈

    具体来说,在这次竞赛中,参赛者们面临着一个挑战,那就是建立一个算法,它需要能够从硅探测器上留下的 3D 点快速重建粒子轨迹。...在这次竞赛中,kaggle 参赛者被要求建立一个算法,这种算法能够快速地从硅探测器上留下的 3D 点重建粒子轨迹。 这是这个比赛两阶段挑战的一部分。...你是怎么做的? 首先,我使用命中位置(x,y,z)作为输入,通过 10 个项目的训练,很容易获得 99% 的准确率。但我很快发现这并不足以重建轨道。...最后,在 0.97TPR 下,对于给定的命中,我平均得到了 80 个负对,并且只有 6 个假阳性对的概率大于真阳性对的平均值。并且只有 6 个负对的概率大于正对的平均值。 你是如何重建轨迹的?...到目前为止,我有一个不太精确的 NxN 关系矩阵,但如果我把它们全部用上,就可以得到很好的轨迹。 重建:找到 N 个轨迹 1.

    76520

    动态三维高斯:通过持续动态视图合成进行跟踪

    为了从原始摄像机图像重建这些粒子,我们利用了在任何时候,它们都可以高效地被溅射到任何摄像机视点的属性,从而可以用图像重建损失进行优化 关键的是,粒子使我们能够使用物理先验,用于优化过程的正则化:局部刚性先验...先前对动态场景的神经重建方法可以被视为要么是欧拉式表示,在固定网格位置跟踪场景运动,要么是拉格朗日式表示,其中观察者跟随特定粒子穿越空间和时间。...第一个时间步作为我们场景的初始化,我们优化所有属性,然后对于后续的时间步,除了定义场景运动的属性外,所有属性都保持不变。...每个时间戳下的旋转参数 ( qw_t , qx_t , qy_t , qz_t )....在 3D 跟踪方面,我们的方法取得了出色的结果,所有场景中所有轨迹的中位轨迹误差仅为 2.21 厘米。这小于通过极其复杂且快速的运动跟踪 150 个时间步骤中手腕的宽度。

    83710

    自动驾驶的技术架构和生态发展

    卷积神经网络(Convolutional Neural Network,CNN)是一种适合使用在连续值输入信号上的深度神经网络,比如声音、图像和视频。...它的历史可以回溯到1968年,Hubel和Wiesel在动物视觉皮层细胞中发现的对输入图案的方向选择性和平移不变性,这个工作为他们赢得了诺贝尔奖。...时间推进到上世纪80年代,随着神经网络研究的深入,研究人员发现对图片输入做卷积操作和生物视觉中的神经元接受局部receptive field内的输入有相似性,那么在神经网络中加上卷积操作也就成了自然的事情...由于CNN在神经网络的结构上针对视觉输入本身特点做的特定设计,所以它是计算机视觉领域使用深度神经网络的不二选择。...无人驾驶的感知部分作为计算机视觉的领域范围,也不可避免地成为CNN发挥作用的舞台。 定位(Localization): ? 定位主要通过粒子滤波进行。

    1.6K50

    国防科技大学提出ROSEFusion,实现快速相机移动下的高精度在线RGB-D重建

    粒子滤波优化的过程如下:以前一帧的相机位姿为中心,在 SE(3)空间中采样大量 6D 位姿作为粒子: 初始权重均为 1。...为此,本文结合粒子群智(particle swarm intelligence)来改进滤波优化方法,充分利用粒子群中的当前最优解来引导粒子的移动,实现基于粒子群智的动力学模型。...,难以获得高质量的相机轨迹作为真值,作者采用激光扫描仪获取了场景的完整三维重建,通过度量三维重建的完整性和准确性来评价相机跟踪的准确性。...可以看出,ROSEFusion 的轨迹精度、重建质量(包括完整性和准确性)都显著高于其它两个方法。...图 10 为 camera_shake_3 序列的重建效果对比,以及相机轨迹精度曲线(不同位姿精度下的帧占比)。

    66640

    GNN for Science: 腾讯AI Lab、清华共同发文综述等变图神经网络

    在物理系统中,有像带电粒子这样的物体,它们通过基于物理定律的力进行相互作用产生运动轨迹。在 NRI 这篇工作中最早引入 n-body 模拟的问题。...n-body 中系统包含多个带电粒子,这些粒子由相互之间的库伦力驱动。n-body 问题的目标是给定系统的初始条件(坐标,速度和电荷量)的情况下预测这些粒子的动力学轨迹。这一任务是 E(3)等变的。...GMN 中进一步提出了一个更有挑战性的问题 -- 带约束的 n-body 问题,即如何在粒子之间有约束,例如连杆或者铰链的情况下对粒子运动轨迹做出有效的预测。...ISO17 则是一个类似的分子动态轨迹数据集,其包含了 129 个同分异构体的轨迹信息。...因为在点云数据里面不存在显式的点和点的链接,在等变图神经网络建模点云的时候,往往会以一个距离 d 作为阈值来构造点和点之间的边。

    1.1K40

    机器学习研究人员需要了解的8个神经网络架构(下)

    Graves&Schmidhuber(2009)表明,带有LSTM的RNN是目前阅读草书的最佳系统。简而言之,他们使用一系列小图像作为输入而不是笔画坐标。...使用这种计算方法的一个简洁的方法是将记忆作为神经网络的能量最小值。 使用能量最小值来表示内存给出了内容可寻址的内存。一个项目只需知道其内容的一部分即可访问。它对硬件损坏很有效。 ?...我们不用网络来存储记忆,而是用它来构建传感输入的解释。输入由可见单位表示,解释由隐藏单位的状态表示,并且解释的缺陷由能量表示。 6.玻尔兹曼机器网络 玻尔兹曼机是一类随机递归神经网络。...他们仍然需要重建这些组件,以便他们必须提取捕获输入之间相关性的功能。如果我们使用一堆去噪的自动编码器,预训练非常有效。它与RBM的预训练一样好或者更好。...3.压缩自动编码器:另一种规范自动编码器的方法是尝试使隐藏单元的活动对输入尽可能不敏感;但他们不能忽视输入,因为他们必须重建。我们通过惩罚每个隐藏活动相对于输入的平方梯度来实现这一点。

    51710

    深度学习求解「三体」问题,计算速度提高一亿倍

    作者 | 姜蔚蔚 编辑 | 唐里 这篇论文试图通过深度神经网络来解决天体力学中著名的三体问题。...与数学家们不同,计算机科学家采取了另一种思路,即通过近似和数值技术来计算分析三体之间的关系。...接下来对神经网络模型而言,作者们使用其中的9900次模拟作为训练集,100次模拟作为训练集。这篇论文中使用的深度神经网络模型是一个包含10个隐藏层、128个节点前馈神经网络,如图2所示: 图2....三种颜色的曲线代表三个例子的运动轨迹,而由于结果太接近,实线代表的神经网络的轨迹和虚线代表的Brutus的轨迹几乎无法分辨,代表经过训练的神经网络令人满意地再现了粒子之间的相互作用。...最后,作者们也尝试利用神经网络来预测粒子的速度信息,但是神经网络在求解问题的时候似乎没有遵循能量守恒定律,作者们在人为加入一个能量投影层之后,才使得预测误差从10-2降低到了10-5,如图6所示。

    1.1K20

    每日学术速递6.13

    先前的光流或粒子视频跟踪算法通常在有限的时间窗口内运行,难以通过遮挡进行跟踪并保持估计运动轨迹的全局一致性。...我们使用的方法允许重建从天底光学机载图像观察到的单个树木的三维结构,这表明即使在存在图像失真的情况下也具有相对稳健的估计和映射能力。...特征可视化试图通过优化可视化高度激活的模式来回答这个重要问题。今天,可视化方法构成了我们对神经网络内部运作的知识基础,作为一种机械可解释性。这里我们要问:特征可视化有多可靠?...我们通过开发网络电路来开始我们的调查,这些网络电路可以欺骗特征可视化来显示与自然输入的正常网络行为完全脱节的任意模式。...然后,我们为标准的、未操纵的网络中发生的类似现象提供证据:特征可视化的处理方式与标准输入的处理方式截然不同,这让人怀疑它们“解释”神经网络如何处理自然图像的能力。

    16210

    ​ICLR2022:清华、腾讯AI Lab共同提出等变图力学网络,实现多刚体物理系统模拟

    如图 1(b)所示,粒子和粒子之间通过连杆连接(连杆两端的粒子只能相对转动),不同连杆可以通过铰链连接(铰链两端的连杆只能相对转动)。...这利用了物理规律关于空间是均匀对称的这一特点,作为模型的归纳偏置,很好地提高了模型的泛化性和解释性。 3. 理论上,GMN 具有良好的表达能力,能很好地逼近任何等变的函数。...因为存在棍子长度约束,所以两个球的运动过程中需要满足两者相对距离不变;换句话说,利用笛卡尔坐标系表示系统的状态,需要引入额外的约束条件,不便于采用神经网络来端到端地表征系统演化规律。...如图 2 右子图所示,可以通过棍子的中心 0 点的笛卡尔坐标 ,以及棍子的相对转角 ,来表示棍子的状态。同时, 可以独立变化,始终不改变棍子的长度,特别利于使用神经网络进行建模。...利用前向运动学,将更新后的广义坐标映射到笛卡尔坐标空间。 值得指出的是,受力的计算、逆向动力学、前向运动学都是通过等变神经网络来实现,极好地满足了物理学的对称性。

    59120

    AI神经网络能模拟量子系统了

    但是当涉及到大量相互作用的粒子时,量子物理定律所解释的现象,大部分和我们的直觉相违背。 为了研究由大量粒子组成的量子系统,物理学家必须首先能够模拟这类系统。...神经网络ansatz对量子系统密度矩阵的图形表示 神经网络的优势在于,它可以用很少的信息来近似模拟波函数或密度矩阵。神经网络就像一个数学“盒子”,将一串数字(矢量或张量)作为输入,并输出另一个字符串。...对于模拟N量子系统的特定任务,神经网络函数可以作为波函数的“猜测”,将N个对象的状态作为输入。然后,研究人员让网络从实际或模拟数据进行“学习”,或将波函数决定的物理量进行最小化,来优化函数参数。...科学家训练了一个神经网络来同时表示多个量子系统,可以通过其环境的影响投射的许多量子态。...稳态自旋结构因子作为α=β的函数计算为3×3点阵,k = 0(上图)和k =(2π/ 3,0)(下图) 这一基于神经网络的方法能够让物理学家预测相当大小的量子系统的性质。

    60020

    《C++ 实时视频流物体跟踪与行为分析全解析》

    在 C++ 实现过程中,需要合理地设置粒子数量、初始化粒子分布以及定义粒子的传播和更新策略,以适应不同场景下的物体跟踪需求,如在跟踪人体姿态变化丰富的运动时,粒子滤波能够更好地适应人体的非线性运动轨迹。...常用的方法有匈牙利算法等,通过构建代价矩阵来衡量不同物体之间的匹配程度,从而确定最优的匹配方案。...行为模型构建 基于规则的模型:C++ 可以方便地实现基于规则的行为分析。例如,定义特定的物体运动轨迹、速度变化、停留时间等规则来判断物体的行为。...例如,使用卷积神经网络对视频中的物体行为进行分类。首先需要收集大量的行为样本数据,通过 C++ 代码进行数据预处理和标注,然后训练神经网络模型。...模型训练完成后,在实时视频流处理中,将每一帧图像输入到模型中,得到物体行为的分类结果,如行走、奔跑、打斗等。 2.

    13810

    前沿 | 受AlphaGo启发,AI重建量子系统新方法登上Nature Physics

    选自Nature等 作者:Giacomo Torlai等 机器之心编译 参与:刘晓坤、许迪、李泽南 这是第一次,物理学家证明了机器学习可以利用相对较少的实验测量结果来重建量子系统。...这种方法在包含几个粒子的简单系统很好用,但是「粒子多了事情就复杂了」Carleo 说。当粒子的数量增加时,复杂度突増。...粒子纠缠进一步使问题变得复杂。通过量子纠缠,独立的粒子变成了纠缠的而且不能被当成纯粹的分离的实体,即使当物理上它们分开的时候。这个纠缠改变了不同量子态的概率。...这些研究员把量子系统的实验性测量输入到了一个以人工神经网络为基础的软件工具中。这个软件学习并尝试去模拟这些系统的行为。一旦软件模拟了足够的数据,它就可以重建整个量子系统。...具体来说,取 p_λ 作为 RBM 网络(λ是参数),以及另一个独立的 RBM 网络 p_µ(µ是参数)来对相位ϕ_µ=log p_µ(x) 建模。

    61860

    ICLR2022:清华、腾讯AI Lab共同提出等变图力学网络,实现多刚体物理系统模拟

    如图 1(b)所示,粒子和粒子之间通过连杆连接(连杆两端的粒子只能相对转动),不同连杆可以通过铰链连接(铰链两端的连杆只能相对转动)。...GMN 具备几个优点: 1.GMN 满足刚体的几何约束,输出不会改变输入的几何属性(如棍子的长度、铰链的连接等)。...因为存在棍子长度约束,所以两个球的运动过程中需要满足两者相对距离不变;换句话说,利用笛卡尔坐标系表示系统的状态,需要引入额外的约束条件,不便于采用神经网络来端到端地表征系统演化规律。...如图 2 右子图所示,可以通过棍子的中心 0 点的笛卡尔坐标 ,以及棍子的相对转角 ,来表示棍子的状态。同时, 可以独立变化,始终不改变棍子的长度,特别利于使用神经网络进行建模。...利用前向运动学,将更新后的广义坐标映射到笛卡尔坐标空间。 值得指出的是,受力的计算、逆向动力学、前向运动学都是通过等变神经网络来实现,极好地满足了物理学的对称性。

    49530

    仅需 5% 训练样本达到最优性能,清华大学研究团队发布条件去噪扩散模型 SPDiff,实现长程人流移动模拟

    早期的研究方法尝试在社会物理学的研究领域,以基于物理规则的模型来解释行人运动背后的机制,进而从异质特性背后抽离出行人运动的本质特征,例如社会力模型。这些方法存在模拟轨迹不够真实自然的问题。...早期的研究对轨迹的随机性分布做出了简化的假设,例如使用高斯分布来建模多模态性,后续的方法利用生成模型,如生成对抗网络 (GANs) 和变分自编码器 (VAEs) 来生成多模态的样本。...近年来,扩散模型作为一个热门的生成模型,已经在许多生成任务中展现出最先进的性能,为了实现真实模拟,本研究全面考虑了以上所讨论的两个需要关注的角度,希望利用扩散模型在建模复杂多模态分布时的优异性能,并利用以社会力模型为代表的社会物理知识来指导本研究扩散模型框架的设计...提出的扩散模型利用图的节点和边信息、历史状态和行人终点信息作为条件输入,并利用扩散模型采样行人未来加速度在下一个时间帧的分布,进而更新下一时刻所有行人的状态。迭代这一过程即可实现任意时长的行为模拟。...如下图所示,扩散模型在训练过程中在定义的时间窗口内模拟轨迹,并计算累积误差作为损失函数以梯度下降更新模型参数。

    17910

    入门 | 机器学习研究者必知的八个神经网络架构

    当机器学习应用于序列时,我们经常希望将输入序列转换为不同域中的输出序列;例如,将一系列的声压转换成单词序列。当没有单独的目标序列时,我们可以通过尝试预测输入序列中的下一项作为网络的学习目标。...整个网络的每个二进制「结构」都有能量,而二进制阈值的决策规则使网络可以得到能量函数的最小值。利用这类计算的一种简洁方法是使用记忆作为神经网络的能量最小值。使用能量最小值来表示记忆从而内存可寻址。...对于预训练任务,实际上有三种不同类型的浅自动编码器: 受限玻尔兹曼机作为自动编码器:当我们用一步对比散度训练受限玻尔兹曼机时,它试图使重建看起来像数据。...去噪自动编码器:通过将其许多分量设置为 0(例如输入的数据丢失的情况),将噪声添加到输入向量。他们仍然需要重建这些分量,因此他们必须提取捕获输入之间相关性的特征。...压缩自动编码器:使自动编码器正规化的另一种方法是尽可能使隐藏单元的活动对输入不敏感,但是他们不能忽视这些输入,因为他们必须重建这些输入。我们通过惩罚每个隐藏活动相对于输入的平方梯度来达到这个目的。

    760130

    2021 最新视频防抖论文+开源代码汇总

    我们的方法不需要预训练数据,而是直接通过三维重建来稳定输入视频。校正阶段结合三维场景深度和摄像机运动,平滑摄像机轨迹,合成稳定的视频。...首先,三维几何优化阶段通过测试时训练,分别用PoseNet和DepthNet估计输入RGB序列的三维摄像机轨迹和稠密场景深度。优化阶段以输入序列和相应的光流作为学习3D场景的引导信号。...其次,视频帧校正阶段以估计的摄像机轨迹和场景深度作为输入,在平滑后的轨迹上进行视点合成。...arxiv.org/pdf/2102.01279.pdf 项目:https://zhmeishi.github.io/dvs/ 摘要: 提出了一种利用传感器数据(陀螺仪)和图像内容(光流)通过无监督学习来稳定视频的深度神经网络...具体而言,对于输入视频,首先对每一帧图像特征进行编码,并在目标时间戳处将相邻帧翘曲至虚拟相机空间。

    2.6K31
    领券