可观测性

✍ dations ◷ 2025-06-28 17:32:42 #自2011-10月需要澄清文字的条目,控制理论

控制理论中的可观察性(observability)是指系统可以由其外部输出推断其其内部状态的程度。系统的可观察性和可控制性是数学上对偶的概念。可观察性最早是匈牙利裔工程师鲁道夫·卡尔曼针对线性动态系统提出的概念。若以信号流图来看,若所有的内部状态都可以输出到输出信号,此系统即有可观察性。

若以正式的定义来看,一系统具有可观察性当且仅当,针对所有的状态向量及控制向量,都可以在有限时间内,只根据输出信号来识别目前的状态(此定义比较接近状态空间的表示方式)。比较不正式的说法,就表示可以根据系统输出来判断整个系统的行为。若系统不可观察,表示其中部分状态的值无法透过输出信号来判定。这也表示控制器无法知道这个状态的值(此时就要透过其他的估测技术才能知道其状态)。

在用状态空间表示的线性时不变系统中,有一个简单的方式来确认系统是否可观测。考虑一个有 n {\displaystyle n} 个状态的单一输入单一输出系统,若以下可观测性矩阵(observability matrix)中的行秩

等于 n {\displaystyle n} ,则此系统为可观测系统。此一测试的原理是若 n {\displaystyle n} 个行是线性独立的,则 n {\displaystyle n} 个状态可以透过输出变数 y ( k ) {\displaystyle y(k)} 的线性组合来得知。

有些系统会利用对输出的量测来估计系统的状态,这类功能的模组称为状态观测器(state observer)或简称为观测器(observer)。

线性时不变系统的可观测性指数(Observability index) v {\displaystyle v} 是满足 rank ( O v ) = rank ( O v + 1 ) {\displaystyle {\text{rank}}{({\mathcal {O}}_{v})}={\text{rank}}{({\mathcal {O}}_{v+1})}} 的最小自然数,其中

线性系统(A,,C)不可观测子空间N是线性映射G的核

其中 C ( t 0 , t 1 ; R n ) {\displaystyle {\mathcal {C}}(t_{0},t_{1};R^{n})} 是连续函数 f : R n {\displaystyle f:\to R^{n}} 的集合,且 Φ ( t 0 , t 1 ) {\displaystyle \Phi (t_{0},t_{1})} 是和A相关的状态传递矩阵。


若(A,,C)是自主系统(autonomous system),N可以改写为

例子:考虑以下的A和C:

若可观测性矩阵定义为 O := ( C T | A T C T ) T {\displaystyle {\mathcal {O}}:=(C^{T}|A^{T}C^{T})^{T}} ,可以计算如下:

因此可以计算可观测性矩阵的核。

O v = 0 {\displaystyle {\mathcal {O}}v=0}

K e r ( O ) = N = s p a n { } {\displaystyle Ker({\mathcal {O}})=N=span\{{\begin{bmatrix}1\\0\end{bmatrix}}\}}

若Rank( O {\displaystyle {\mathcal {O}}} )=n,n为可观测性矩阵中独立行的个数,表示系统可观测。在此例中det( O {\displaystyle {\mathcal {O}}} )=0,因此Rank( O {\displaystyle {\mathcal {O}}} )<n,此系统不可观测。

因为不可观测子空间为 R n {\displaystyle R^{n}} 的子空间,因此以下的性质成立:

可侦测性(detectability)是比可观测性略弱一些的条件。若系统内所有不可侦测的状态都是稳定的,此系统即具有可侦测性。

考虑连续时间下的线性时变系统

t ; {\displaystyle t\in ;} 的时间内, A , B {\displaystyle A,B} C {\displaystyle C} 矩阵都已知,而输入及输出 u {\displaystyle u} y {\displaystyle y} 也都已知,可以透过一个额外在 M ( t 0 , t 1 ) {\displaystyle M(t_{0},t_{1})} 核之内的向量来确认 x ( t 0 ) {\displaystyle x(t_{0})} M ( t 0 , t 1 ) {\displaystyle M(t_{0},t_{1})} 定义如下

其中 ϕ {\displaystyle \phi } 为状态转换矩阵。

M ( t 0 , t 1 ) {\displaystyle M(t_{0},t_{1})} 为非奇异方阵,可以找到一个唯一的 x ( t 0 ) {\displaystyle x(t_{0})} 。而且若 x 1 x 2 {\displaystyle x_{1}-x_{2}} 是在 M ( t 0 , t 1 ) {\displaystyle M(t_{0},t_{1})} 的核内,不可能由 x 2 {\displaystyle x_{2}} 找到对应的启始状态 x 1 {\displaystyle x_{1}}

上述定义的 M {\displaystyle M} 有以下的特性:

系统在可观测,当且仅当在存在区间 \in R {\displaystyle \mathbb {R} } ,使得矩阵 M ( t 0 , t 1 ) {\displaystyle M(t_{0},t_{1})} 为非奇异方阵。

A ( t ) , C ( t ) {\displaystyle A(t),C(t)} 可解析,则系统在可观测的条件是存在 t ¯ {\displaystyle {\bar {t}}\in } 以及正数k使得

其中 N 0 ( t ) := C ( t ) {\displaystyle N_{0}(t):=C(t)} ,而 N i ( t ) {\displaystyle N_{i}(t)} 可用以下方式递回定义

考虑一个在 ( , ) {\displaystyle (-\infty ,\infty )} 内解析的时变系统,矩阵为

A ( t ) = {\displaystyle A(t)={\begin{bmatrix}t&1&0\\0&t^{3}&0\\0&0&t^{2}\end{bmatrix}}} , C ( t ) = . {\displaystyle C(t)={\begin{bmatrix}1&0&1\end{bmatrix}}.} = {\displaystyle {\begin{bmatrix}N_{0}(0)\\N_{1}(0)\\N_{2}(0)\end{bmatrix}}={\begin{bmatrix}1&0&1\\0&-1&0\\1&0&0\end{bmatrix}}} ,因为矩阵的秩为3,因此在 R {\displaystyle \mathbb {R} } 内所有非平凡区间内都是可控制的。

假设系统 x ˙ = f ( x ) + j = 1 m g j ( x ) u j {\displaystyle {\dot {x}}=f(x)+\sum _{j=1}^{m}g_{j}(x)u_{j}} , y i = h i ( x ) , i p {\displaystyle y_{i}=h_{i}(x),i\in p} ,其中 x R n {\displaystyle x\in \mathbb {R} ^{n}} 为状态向量, u R m {\displaystyle u\in \mathbb {R} ^{m}} 为输入向量,而 y R p {\displaystyle y\in \mathbb {R} ^{p}} 为输出向量。 f , g , h {\displaystyle f,g,h} 都是光滑的向量场。

定义可观测空间 O s {\displaystyle {\mathcal {O}}_{s}} 为包括所有李导数及多重李导数的空间。此空间在 x 0 {\displaystyle x_{0}} 可观测当且仅当 dim ( d O s ( x 0 ) ) = n {\displaystyle {\textrm {dim}}(d{\mathcal {O}}_{s}(x_{0}))=n}

d O s ( x 0 ) = s p a n ( d h 1 ( x 0 ) , , d h p ( x 0 ) , d L v i L v i 1 , , L v 1 h j ( x 0 ) ) ,   j p , k = 1 , 2 , . {\displaystyle d{\mathcal {O}}_{s}(x_{0})=\mathrm {span} (dh_{1}(x_{0}),\ldots ,dh_{p}(x_{0}),dL_{v_{i}}L_{v_{i-1}},\ldots ,L_{v_{1}}h_{j}(x_{0})),\ j\in p,k=1,2,\ldots .}

Griffith及Kumar,、Kou、Elliot及Tarn及Singh是早期发展非线性动态系统的可观测性准则的先驱。

可观测性也可以用来描述稳态系统(一般会用代数方程及不等式来定义),甚至是 R n {\displaystyle \mathbb {R} ^{n}} 内的集合。就像可观测性准则可以预测动态系统中卡尔曼滤波或其他观测器的行为一様, R n {\displaystyle \mathbb {R} ^{n}} 内集合的可观测性准则也可以预测data reconciliation(英语:data validation and reconciliation)及其他静态观测器的行为。在非线性的例子中,可以针对个别变数或区部特性来判断可观测性,不需针对全域特性来判断。

相关

  • 查尔斯·莱尔查尔斯·莱尔爵士,第一代从男爵(英语:Sir Charles Lyell, 1st Baronet,FRS,1797年11月14日-1875年2月22日),英国地质学家、律师,是均变说的重要论述者。查尔斯·莱尔出生于苏格兰,是家
  • 卡尔·冯·弗里希卡尔·冯·弗里希骑士(Karl Ritter von Frisch,1886年11月20日-1982年6月12日),奥地利动物行为学家,1973年与康拉德·洛伦兹、尼可拉斯·庭伯根共同获得了1973年诺贝尔生理学或医
  • 巴巴多斯中华民国与巴巴多斯关系是指中华民国与巴巴多斯之间的关系。两国于1967-1977年有官方外交关系,断交后,目前没有在对方首都互设具大使馆性质的代表机构。对巴巴多斯的相关事务由
  • JMA气象厅(日语:気象庁/きしょうちょう Kishō chō,Japan Meteorological Agency,JMA)是日本国土交通省辖下的外局之一(国土交通省设置法(日语:国土交通省設置法)第46条),根据《气象业务
  • 凯西·贝兹凯西·贝兹(Kathy Bates,1948年6月28日-)是一位资深美国实力派影视演员及电影导演,屡次获提名奥斯卡最佳女配角奖及金球奖,更于1991年以《米泽丽》(Misery)赢得第63届奥斯卡最佳女主
  • 租调租庸调制,唐朝一度实行的赋税制度,以征收谷物、布匹或者为政府服役为主。租庸调定须均田制的配合,一旦均田破坏,租庸调法则失败,武周后由于人口增加,又不断土地兼并,公家已无土地实
  • 柠檬社会主义柠檬社会主义(英语:Lemon socialism)是一个经济学上的专有名词。其实质是一种半套式的资本主义,是指发达资本主义国家在2008年全球金融危机中挽救陷入困境的金融机构的普遍政策
  • 倒角二十面体在几何学中,倒角十二面体是一种凸多面体,可由十二面体经过倒角变换构成,也可由菱形三十面体截去20个相邻三个面的顶点构成。倒角十二面体六边形面可以是等边六边形但不是正六边
  • ATC代码 (V09)A·B·C·D·G·H·QI·J·L·M·N·P·R·S·VATC代码V09(诊断用放射性药物)是解剖学治疗学及化学分类系统的一个药物分组,这是由世界卫生组织药物统计方法整合中心(The WHO Co
  • 新格列布利亚 (卡利尼夫卡区)坐标:49°28′0″N 28°45′52″E / 49.46667°N 28.76444°E / 49.46667; 28.76444新格列布利亚(乌克兰语:Нова Гребля),是乌克兰的城镇,位于该国西南部文尼察州,由卡利