利用动态规划求解连续系统的最优控制问题的一些简要但重要的说明,并介绍H-J-B定理。
1、求解的复杂性:
在采用动态规划对连续系统进行最优控制问题求解时,我们需要求解偏微分方程;而采用最小值原理求解时,得到一组常微分方程。
考虑到求解偏微分方程比解常微分方程困难得多,所以一般都很难得到问题的最优控制的解析解,往往都是通过计算机求得数值解。
虽然在求解复杂性上动态规划比最小值原理要困难,但由于计算机的性能提升,该原因所引起的困难正在逐步减小。
2、可用性:
动态规划法在求解最优控制的时候,得到的最优控制表达式是关于该时刻的状态量,虽然 u* 与状态 x 的关系可能是时变的,但无论应用在什么地方,都可以利用系统的状态反馈来实现,从而构成状态反馈的闭环控制律。
变分法或最小值原理往往将最优控制表示为时间 t 的函数,难以甚至不能将最优控制表示成状态的函数,属于开环控制方式。
3、最优性:
前面几篇文章中已经说过,动态规划得到的算法是满足最优性原理的。也就是说,无论初始时刻和初始状态如何变化,只要系统的状态方程不变,性能指标不变,最优控制就不变。
4、适用性:
哈密顿-雅可比-贝尔曼方程所代表的是系统性能指标达到最小值的充分条件,而不是必要条件或充要条件,这与最小值原理不同。所以应用过程中需要注意条件。
此外,可以采用最小值原理求解的最优控制问题未必能够给出H-J-B方程。因为对于许多工程问题来说,最优性能指标函数的可微性常常得不到满足。
5、H-J-B定理:
给定 n 阶系统状态方程:
性能指标:
若满足下列条件:
1、函数 f 和 L 对其自变量是连续可微的;
2、
对 u(t) 来说存在最小值,且其最小值点
对所有的自变量连续可微;
3、 J*[x(t),t] 是H-J-B方程,即
满足边界条件 J*[x(tf),tf]=0 的解,则J*[x(t),t]是性能指标
的最优值。而
是上述这类问题的最优控制。
本阶段全套笔记:
【最优控制理论与仿真】
公众号内还有:
【经典控制理论】全套笔记
【现代控制理论】全套笔记
【非线性控制理论】全套笔记
【车辆动力学】全套笔记
后续全套笔记:
【反步控制】(Back-Stepping Control)
【滑模控制】(Sliding Mode Control)
【模型预测控制】(Model Predictive Control)
【自适应控制】(Adaptive Control)
【鲁棒控制】(Robust Control)
【自抗扰控制】(ADRControl)
以及各类车辆数学模型、基于底盘的控制算法实例等内容
期待您的关注、留言、讨论!
领取专属 10元无门槛券
私享最新 技术干货