前面几节中介绍了连续系统的在线LQR算法和离线LQR算法,以及时间最优控制、燃料最优控制等相关算法。具体可参看如下笔记链接:
最优控制理论笔记总结(17)——一般最优控制仿真举例(含Matlab实现代码)
最优控制理论笔记总结(19)——在线LQR算法(有限时间状态调节器最优控制)
最优控制理论笔记总结(20)——无限时间状态调节器最优控制(离线LQR)
最优控制理论笔记总结(22)——(目标跟踪的LQR算法)最优控制算法跟踪问题
最优控制理论笔记总结(24)——倒立摆的最优控制仿真举例(含Matlab实现代码)
为了使LQR算法应用于实际工业产品,下面对(在线/离线)的离散LQR算法进行介绍。
1、离散LQR算法(有限时间):
在第25节中已经介绍了连续系统离散化后的表达式为:
(具体推导过程请参看本公众号相关笔记“最优控制理论笔记总结(25)——连续系统的离散化、离散最优控制问题数学表达”,不再赘述)。
设初始状态:
二次型性能指标一般设为:
算法的任务:确定控制信号
使性能指标达到极小值。
系统哈密顿函数可写为:
对应控制方程为:
所以,离散两点边界值问题可以被描述为:
为给出系统闭式解,假设:
带入上面的离散两点边界值问题,可得:
对上面两个式子进行合并,消去 x(i+1) 得:
为了使上式对任意状态 x(i) 都成立,P(i) 必须满足如下 Riccati 差分方程:
若
存在
则
所以最优控制为:
式中,
称为“状态反馈矩阵”。
2、离散LQR算法(无限时间):
被控对象为:
初始状态为:
反馈控制为:
性能指标为:
算法的任务:确定控制信号
使性能指标达到极小值。
3、给出如下定理以确定上述最优反馈控制律:
定理:线性二次型最优控制问题的反馈控制 u* = -K*x(i) 使闭环系统矩阵
渐近稳定的充要条件是
其中,
满足Riccati 方程:
以上,便实现了在线离散LQR算法的求解和离线离散LQR算法的求解过程。
本阶段全套笔记:
【最优控制理论与仿真】
公众号内还有:
【经典控制理论】全套笔记
【现代控制理论】全套笔记
【非线性控制理论】全套笔记
【车辆动力学】全套笔记
下阶段全套笔记:
【模型预测控制理论与仿真】
期待您的关注、留言、讨论!
领取专属 10元无门槛券
私享最新 技术干货