代数Riccati方程

✍ dations ◷ 2025-08-18 05:11:22 #矩阵,方程,最佳控制

代数Riccati方程(algebraic Riccati equation)是最优控制的非线性方程,和连续时间(英语:continuous time)或是离散时间下,无限时间(infinite-horizon)的最优控制有关。

标准的代数Riccati方程如下:

连续时间代数Riccati方程(CARE):

离散时间代数Riccati方程(DARE):

是未知数的×对称矩阵,、、及是已知实系数矩阵。

一般而言此方程式有许多的解,不过若有存在稳定解的话,希望可以找到稳定解。

此方程名称中有Riccati,是因为和Riccati方程的关系。连续时间代数Riccati方程(CARE)可以由相关矩阵值的Riccati微分方程的非时变解来验证。离散时间代数Riccati方程(DARE)可以由矩阵值的Riccati微分方程的非时变解来验证(类似离散时间LQR下的Riccati微分方程)。

在无限时间的最佳控制问题中,关注的是一些变数在相当时间之后的值,因此需在现在选定控制变数的值,让系统在之后的时间都在最佳状态下运作。控制变数在任意时间下的最佳值可以用Riccati方程的解以及状态变数当时的观测值求得。若观测变数及控制变数都不只一个,Riccati方程就会是矩阵方程。

代数Riccati方程可以决定无限时间下非时变LQR控制器的解,以及无限时间下非时变LQG控制的解。这两个是控制理论中的基础问题。

典型的离散时间LQR问题,是要最小化以下的函数

其状态方程如下

其中 是 × 1 的状态变数向量, 是 × 1 的控制变数向量, 是 × 的状态递移矩阵, 是 × 的控制系数矩阵, ( × ) 是对应半正定状态损失函数矩阵, ( × ) 是对应正定的控制损失函数矩阵。

从最后时间往前的推导可以找到每一个时间的最佳控制解

其中对应正定cost-to-go矩阵 会依下式,配合 P T = Q {\displaystyle P_{T}=Q} 的稳态解和和趋近无限大时的无限时间问题有关,可以将动态方程反复迭代直到收敛,来求得的稳态解,之后再将动态方程中的时间标注移除,来确认稳态解是否正确。

若代数Riccati方程存在稳定解,求解器一般会设法找到唯一的稳定解。稳定解的意思是指用此解控制相关的LQR系统,可以使闭回路的系统稳定。

针对CARE,其控制律为

闭回路递移矩阵为

其稳定的充份必要条件是所有的特征值都有负的实部。

针对DARE,其控制律为

闭回路递移矩阵为

其稳定的充份必要条件是所有的特征值在复数平面的单位圆内。

代数Riccati方程的解可以用Riccati方程的的迭代或是矩阵因式分解求得。离散时间问题的一种迭代方式是由有限时间问题下的动态Riccati方程,每一次迭代时,矩阵中的值都是从最终时间往前一段有限时间内的最佳解,若进行无限长的迭代。就会分敛到特定矩阵,是无限时间内的最佳解。

针对大型系统,也可以用找特征分解的方式求解。针对CARE,可以定义汉弥尔顿矩阵

因为 Z {\displaystyle \scriptstyle Z} 是汉弥尔顿矩阵,若在虚轴上没有特征值,则会有恰好一半的特征值会有负的实部。若定义 2 n × n {\displaystyle \scriptstyle 2n\times n} 矩阵,其纵排(column)形成对应子空间的基底,表示为区块矩阵的形式,如下所示

是Riccati方程的解。而且 A B R 1 B T P {\displaystyle \scriptstyle A-BR^{-1}B^{T}P} 的特征值即为 Z {\displaystyle \scriptstyle Z} 特征值中有负实部的特征值。

针对DARE,若 A {\displaystyle A} 是可逆矩阵,可以定义辛矩阵

因为 Z {\displaystyle \scriptstyle Z} 是辛矩阵,若在单位圆圆周上没有特征值,则会有恰好一半的特征值会在单位圆内。若定义 2 n × n {\displaystyle \scriptstyle 2n\times n} 矩阵,其纵排(column)形成对应子空间的基底,表示为区块矩阵的形式,如下所示则

是Riccati方程的解。而且 A B ( R + B T P B ) 1 B T P A {\displaystyle \scriptstyle A-B(R+B^{T}PB)^{-1}B^{T}PA} 的特征值即为 Z {\displaystyle \scriptstyle Z} 特征值中,在单位圆内的特征值。

相关

  • At4f14 5d10 6s2 6p52, 8, 18, 32, 18, 7蒸气压主条目:砹的同位素砹(Astatine,台湾译作砈,旧讹作“鈪”、“銰”)是一种具有极高放射性的化学元素,符号为At,原子序为85。地球上所有的
  • 褶皱褶皱是层状岩石受力后形成的波状弯曲。绝大多数的层状岩石是由堆积在盆地、海岸的平坦水平成层的沉积物形成,如隆升出露地面,形成水平岩层。褶皱有两种基本类型:褶皱的形成与受
  • 三宅岛坐标:34°05′37″N 139°31′34″E / 34.0936°N 139.5261°E / 34.0936; 139.5261三宅岛是日本伊豆诸岛中的一个岛屿。位于东京以南175公里,伊豆大岛南方57公里的海面上。在
  • 上海交通大学安泰经济与管理学院上海交通大学安泰经济与管理学院,为上海交通大学所属学院之一,建立于1918年,与美国安泰国际集团Aetna合建。英国金融时报(Financial Times)商学院排行榜中,亚太第1。 现任院长为运
  • 贺锦丽卡玛拉·德维·哈里斯(英语:Kamala Devi Harris;/ˈkɑːmələ/;1964年10月20日-),中文名贺锦丽,是一名美国律师、政治人物与民主党成员。她曾担任第32任加州检察总长,现时是加利福
  • 冈萨雷斯诉卡哈特案冈萨雷斯诉卡哈特案(Gonzales v. Carhart,550 U.S.(2007)),是近年美国联邦最高法院对于妇女堕胎问题的重要案例,最高法院推翻下级法院见解,认为2003年经由美国总统小布什签署的联
  • 癸烷正癸烷是化学式为CH3(CH2)8CH3的烷烃,总共有136种异构体,若不计立体异构则为75个,全都是可燃液体。癸烷是汽油的组分之一。与其他烷烃类似,癸烷是非极性分子,不易溶于水之类的极
  • 52号科罗拉多州州道52号科罗拉多州州道(英语:Colorado State Highway 52,SH-52)是美国科罗拉多州北部的一条东北-西南走向的州级公路,全长111英里(179千米),西起圆石县东北的尼沃特接119号科罗拉多州州
  • 玄广惠探玄广惠探(1517年-1536年6月28日)是日本战国时代武将。今川氏亲之子。母亲是今川氏有力家臣福岛正成(一说是上总介)之女。一说指正名是今川良真。今川义元的庶兄。与异母兄弟梅岳
  • 南半球极光雷达实验南半球极光雷达实验(Southern Hemisphere Auroral Radar Experiment,简称SHARE)是项南极研究计划设计去观察电离层和磁层中电场的速度及不规则性。计划开始于1988年,南半球极