专栏首页arxiv.org翻译专栏具有主要和次要代理以及非高斯噪声的分散线性二次系统(CS RO)
原创

具有主要和次要代理以及非高斯噪声的分散线性二次系统(CS RO)

我们考虑具有主要代理人和次要代理人的分散线性二次系统。代理商的动力和二次成本是耦合的。尤其是动力学是线性的。主要代理的状态和控制行为会影响所有次要代理的状态演变,但次要代理的状态和控制行为不会影响主要或其他次要代理的状态演变。该系统具有部分嵌套的信息结构的部分输出反馈。特别是,主要代理完全观察其自身状态,而每个次要代理完全观察主要代理状态并部分观察其自身状态。不假定噪声过程具有高斯分布。对于此模型,我们描述了最佳和最佳线性策略的结构。我们表明,主要代理的最佳控制是系统状态的主要代理的MMSE(最小均方误差)估计的线性函数,次要代理的最佳控制是系统的主要代理的MMSE估计的线性函数。系统状态和“校正项”,该“校正项”取决于未成年人代理对本地状态的MMSE估计值与主要代理对未成年人本地状态的MMSE估计值的差异。主代理的MMSE估计是其观测值的线性函数,而辅代理的MMSE估计是其观测值的非线性函数,该函数根据非线性贝叶斯滤波器进行更新。我们表明,如果用次要代理人的LLMS(线性最小均方)估计值代替次要代理人的MMSE估计值,那么所得策略就是最佳线性控制策略。我们使用直接证明来证明结果,该直接证明基于条件独立性,状态和控制动作的拆分,简化每步成本,正交性原则以及正方形的完成。

原文题目:Decentralized linear quadratic systems with major and minor agents and non-Gaussian noise

原文:We consider a decentralized linear quadratic system with a major agent and a collection of minor agents. The agents are coupled in their dynamics as well as a quadratic cost. In particular, the dynamics are linear; the state and control action of the major agent affect the state evolution of all the minor agents but the state and the control action of the minor agents do not affect the state evolution of the major or other minor agents. The system has partial output feedback with partially nested information structure. In particular, the major agent perfectly observes its own state while each minor agent perfectly observes the state of the major agent and partially observes its own state. It is not assumed that the noise process has a Gaussian distribution. For this model, we characterize the structure of the optimal and the best linear strategies. We show that the optimal control of the major agent is a linear function of the major agent's MMSE (minimum mean squared error) estimate of the system state and the optimal control of a minor agent is a linear function of the major agent's MMSE estimate of the system state and a "correction term" which depends on the difference of the minor agent's MMSE estimate of its local state and the major agent's MMSE estimate of the minor agent's local state. The major agent's MMSE estimate is a linear function of its observations while the minor agent's MMSE estimate is a non-linear function of its observations which is updated according to the non-linear Bayesian filter. We show that if we replace the minor agent's MMSE estimate by its LLMS (linear least mean square) estimate, then the resultant strategy is the best linear control strategy. We prove the result using a direct proof which is based on conditional independence, splitting of the state and control actions, simplifying the per-step cost, orthogonality principle, and completion of squares.

原文作者:Mohammad Afshari,Aditya Mahajan

原文地址:https://arxiv.org/abs/2004.11856

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 在室内环境中使用二次曲面和对称属性的面向对象SLAM(CS RO)

    针对室内移动机器人的应用环境,提出了一种基于RGB-D摄像机的稀疏对象级SLAM算法。二次表示用作界标以紧凑地建模对象,包括对象的位置,方向和占用的空间。现有的...

    时代在召唤
  • 耳面部外科应用的RCM新机制(CS RO)

    由于中耳或鼻窦腔的插入区域非常狭窄,内窥镜的活动性降低为围绕虚拟点旋转和平移以插入相机。本文首先介绍了从三维扫描中获得的这些区域的解剖结构,然后介绍了一种基于敏...

    时代在召唤
  • 推和拖:水果收获机器人的主动障碍物分离方法(CS RO)

    选择性地采摘被障碍物包围的目标水果是水果收获机器人的主要挑战之一。与传统的避障方法不同,本文提出了一种结合了推和拖动作的主动式障碍物分离策略。分离运动和轨迹是基...

    时代在召唤
  • SPARK框架下实现CPM(派系协同过滤算法)

    以下是我的Readme陈述算法思路,还没写完,先发上来,增加浏览量,之后部分我近几天补充。

    Donuts_choco
  • 图说jdk1.8新特性(5)--- 编译器新特性

    SecondWorld
  • String

    青木
  • 数据可视化的10个关键术语

    Format 交互方式 Interactive visualisations allow you to modify, manipulate and explo...

    CSDN技术头条
  • 统计学中的区间估计

    统计学中有两大分支——描述性统计学(description stats)和推断性统计学(inference stats)。 推断性统计学中,很重要的一点就是...

    用户1147754
  • 【译文】数据可视化的10个关键术语①

    Format 交互方式 Interactive visualisations allow you to modify, manipulate and expl...

    小莹莹
  • 搜索专题4 | 旋转棋盘 POJ - 2286

    The rotation game uses a # shaped board, which can hold 24 pieces of square bloc...

    ACM算法日常

扫码关注云+社区

领取腾讯云代金券