专栏首页arxiv.org翻译专栏具有增强闭环稳定性的神经网络最优反馈控制

具有增强闭环稳定性的神经网络最优反馈控制

最近的研究表明,监督学习是设计高维非线性动态系统最优反馈控制器的有效工具。但是这些神经网络(NN)控制器的行为仍然没有得到很好的理解。在本文中,我们使用数值模拟来证明典型的测试精度指标不能有效地捕获神经网络控制器稳定系统的能力。特别是,一些具有高测试精度的神经网络可能无法稳定动态。为此,我们提出了两种局部近似线性二次调节器(LQR)的神经网络结构。数值模拟证实了我们的直觉,即所提出的结构在不牺牲性能的情况下可靠地产生稳定反馈控制器。此外,我们还介绍了描述此类神经网络控制系统稳定性的初步理论结果。

原文标题:Neural network optimal feedback control with enhanced closed loop stability

原文:Recent research has shown that supervised learning can be an effective tool for designing optimal feedback controllers for high-dimensional nonlinear dynamic systems. But the behavior of these neural network (NN) controllers is still not well understood. In this paper we use numerical simulations to demonstrate that typical test accuracy metrics do not effectively capture the ability of an NN controller to stabilize a system. In particular, some NNs with high test accuracy can fail to stabilize the dynamics. To address this we propose two NN architectures which locally approximate a linear quadratic regulator (LQR). Numerical simulations confirm our intuition that the proposed architectures reliably produce stabilizing feedback controllers without sacrificing performance. In addition, we introduce a preliminary theoretical result describing some stability properties of such NN-controlled systems.

原文链接:https://arxiv.org/abs/2109.07466

原文作者:Tenavi Nakamura-Zimmerer, Qi Gong, Wei Kang

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【NLP/AI算法面试必备】学习NLP/AI,必须深入理解“神经网络及其优化问题”

    一、神经网络基础和前馈神经网络 1、神经网络中的激活函数:对比ReLU与Sigmoid、Tanh的优缺点?ReLU有哪些变种? 2、神经网络结构哪几种?各自都有...

    AI研习社
  • 值得收藏!脑机接口概述专题二 | 从运动脑机接口到情绪脑机接口:运动脑机接口

    闭环控制的理念推动了脑机接口解码器的发展。包括调整解码器的构造和训练方式以及引导感觉运动脑机接口形成新的控制通路(图2)。类似于我们学习新的自然技能,用户可以通...

    脑机接口社区
  • 脑机接口概述专题一 | 从运动脑机接口到情绪脑机接口:马斯克脑机接口公司Neuralink背后的原理

    编者的话:这篇文章是专业顶刊里发表的唯一一篇提出把脑机接口概念从运动系统扩展到情绪系统的观点文章,而且从系统实现的角度该说的基本也都说了。本质上讲,脑机接口是控...

    脑机接口社区
  • 前沿 | CNN取代RNN?当序列建模不再需要循环网络

    在这篇博文中,我们来探讨循环网络模型和前馈模型之间的取舍。前馈模型可以提高训练稳定性和速度,而循环模型表达能力更胜一筹。有趣的是,额外的表现力似乎并没有提高循环...

    机器之心
  • Richard S. Sutton经典图书:《强化学习导论》第二版(附PDF下载)

    【导读】Richard S. Sutton就职于iCORE大学计算机科学系,是强化学习领域的专家,其在强化学习领域的著作“Reinforcement Learn...

    WZEARW
  • Nat. Mach. Intell. | FBGAN:优化蛋白质功能的反馈-循环架构

    今天给大家介绍的是由斯坦福大学Anvita Gupta和James Zou两人在“Nature Machine Intelligence”上发表的文章” Fee...

    DrugAI
  • 重磅 | 经典教材 R. Sutton《增强学习导论》最新版(451PDF)

    2016年10月18日, 世界人工智能大会技术分论坛,特设“新智元智库院长圆桌会议”,重量级研究院院长 7 剑下天山,汇集了中国人工智能产学研三界最豪华院长阵容...

    新智元
  • PID算法知识点博文收藏记录

    https://blog.csdn.net/Uncle_GUO/article/details/51367764

    用户4645519
  • 深度强化学习智能交通 (I) :深度强化学习概述

    随着城市化进程的加快和自动技术的最新发展,交通研究逐渐向智能化方向发展,称为智能交通系统(ITS)。人工智能(AI)试图用最少的人工干预来控制系统。智能交通系统...

    数据酷客
  • 工业机器人的主要部件、材料、构形与控制系统

    一、工业机器人的主要组成部分 ? 1、机器人驱动装置 概念:要使机器人运行起来, 需给各个关节即每个运动自由度安置传动装置 作用:提供机器人各部位、各关节动作的...

    机器人网
  • BBR及其在实时音视频领域的应用

    大家好,我是网易云信音视频工程师肖磊,目前致力于实时音视频领域的QoS研究,通过优化拥塞控制算法,为用户提供高带宽利用率,低延时,抗抖动能力强的实时音视频服务。

    LiveVideoStack
  • 人工神经网络简介

    概要:人工神经网络简称神经网络,是基于生物学中神经网络的基本原理。 一、人工神经网络的概念 人工神经网络(Artificial Neural Network,...

    陆勤_数据人网
  • 面试热点|浅谈TCP/IP传输层TCP BBR算法

    这是TCP/IP协议栈系列的第三篇文章,之前的一篇面试热点|理解TCP/IP传输层拥塞控制算法讲述了传统的拥塞控制算法基本原理,今天一起来学习下最新Linux内...

    轩辕之风
  • 一文看尽深度学习RNN:为啥就它适合语音识别、NLP与机器翻译?

    本文是机器学习大牛Jason Brownlee系统介绍RNN的文章,他在文中详细对比了LSTM、GRU与NTM三大主流架构在深度学习上的工作原理及各自特性。读过...

    AI科技大本营
  • 循环神经网络(RNN)和LSTM初学者指南 | 入门资料

    最近,有一篇入门文章引发了不少关注。文章中详细介绍了循环神经网络(RNN),及其变体长短期记忆(LSTM)背后的原理。

    量子位
  • 【Copy攻城狮日志】强化学习7天打卡营学习笔记

    ↑开局一张图,故事全靠编。我常常会扪心自问,一个连本行工作都干不好的人,还有时间去捣鼓别的领域,去“学习”别的领域的新知识?然鹅,自诩为“Copy攻城狮”的我,...

    胡琦
  • 学界丨MIT重磅研究:基于人工神经网络,探索抑制神经元的生物学意义

    在近几年,人工神经网络——一种参照大脑运作模式而建成的计算模型——已经成为了最为炙手可热的人工智能系统,并且应用于从语音到图像的各个领域。 AI科技评论消息,M...

    AI科技评论
  • 重磅 | 经典教材 R. Sutton《增强学习导论》最新版(548PDF)

    新智元
  • 学界 | 为卷积模型执行加入循环和远程反馈,更完整地拟合生物视觉

    大脑的感觉系统必须要在复杂的有噪声感觉数据中检测出有意义的模式 [James, 1890]。视觉环境可以揭示对象的积极或消极性质,包括食物种类、危险标志以及令人...

    机器之心

扫码关注云+社区

领取腾讯云代金券