庞特里亚金最大化原理

✍ dations ◷ 2025-10-19 13:01:41 #庞特里亚金最大化原理

庞特里亚金最大化原理(Pontryagin's maximum principle)也根据使用条件称为庞特里亚金最小化原理或最大值原理及最小值原理,是最优控制中的理论,是在状态或是输入控件有限制条件的情形下,可以找到将动力系统由一个状态到另一个状态的最优控制信号。此理论是苏俄数学家列夫·庞特里亚金及他的学生在1956年提出的。这是变分法中欧拉-拉格朗日方程的特例。

简单来说,此定理是指在所有可能的控制中,需让“控制哈密顿量”(control Hamiltonian)取极值,极值是最大值或是最小值则依问题以及哈密顿量的符号定义而不同。正式的用法,也就是哈密顿量中所使用的符号,会取到最大值,但是此条目中使用的符号定义方式,会让极值取到最小值。

U {displaystyle {mathcal {U}}} 是所有可能控制值的集合,则此原理指出,最优控制 u {displaystyle u^{*}} 必须满足以下条件:

其中 x C 1 {displaystyle x^{*}in C^{1}} 是最佳状态轨迹,而 λ B V {displaystyle lambda ^{*}in BV} 是最佳 协态轨迹

此结果最早成功的应用在输入控制有限制条件的最小时间问题中,不过也可以用在状态有限制条件的问题中。

也可以推导控制哈密顿量的特殊条件。若最终时间 t f {displaystyle t_{f}} 固定,且控制哈密顿量不是时间的显函数 ( H t 0 ) {displaystyle left({tfrac {partial H}{partial t}}equiv 0right)} ,则:

若最终时间没有限制,则:

若在某一轨迹上满足庞特里亚金最大化原理,此原理是最佳解的必要条件。哈密顿-雅可比-贝尔曼方程 提供了最佳解的充份必要条件,但该条件须在整个状态空间中都要成立。

此定理一开始的名称是庞特里亚金最大化原理(Pontryagin's maximum principle),其证明也是以控制哈密顿量最大化为基础。此原理最早的应用是要最大化火箭的终端速度。不过后来此定理大部分的应用是使性能指标最小化,因此常称为庞特里亚金最小化原理。庞特里亚金的书解出了要让性能指标最小化的问题

以下的内容会使用这些表示方式

以下是让泛函最小化的必要条件。令 x {displaystyle x} 为在输入为 u {displaystyle u} 时,动态系统的状态,且满足以下条件

其中

控制 u U {displaystyle uin {mathcal {U}}} 需在所有 t {displaystyle tin } 内使目标泛函 J {displaystyle J} 最小化,目标泛函 J {displaystyle J} 随应用而定,可以写成

系统动态的限制可以用导入时变拉格朗日乘数向量 λ {displaystyle lambda } 的方式和 L {displaystyle L} 相加,而拉格朗日乘数向量 λ {displaystyle lambda } 的元素称为系统的协态(costate)。因此可以建构在所有 t {displaystyle tin } 的哈密顿量为:

其中 λ T {displaystyle lambda ^{rm {T}}} λ {displaystyle lambda } 的转置。

庞特里亚金最小化原理提到最佳状态轨迹 x {displaystyle x^{*}} ,最佳控制 u {displaystyle u^{*}} 及对应的拉格朗日乘数向量 λ {displaystyle lambda ^{*}} 必需最小化哈密顿量 H {displaystyle H} ,因此

针对所有 t {displaystyle tin } 时间,也针对所有可能的控制输入 u U {displaystyle uin {mathcal {U}}} 。以下的式子也必须成立

而且也要满足以下的协态方程

若最终状态 x ( T ) {displaystyle x(T)} 没有固定(其微分变异不为0),最终协态也要满足以下条件

上述(1)-(4)的条件是最佳控制的必要条件。公式(4)只有在 x ( T ) {displaystyle x(T)} 没有固定时才需要成立。若 x ( T ) {displaystyle x(T)} 是固定值,公式(4)不在必要条件中。

此解法可以应用在宇宙学和天体物理学中 。

相关

  • 绍曾德奥克斯千橡市或千橡城(Thousand Oaks),又音译作绍曾德奥克斯,是美国加利福尼亚州文图拉县的一个城市,位于该县东南部,是康谷的人口集中地。当地因为生长有很多橡树而得名。它是1950年代
  • 2014年美国周末票房冠军2014年美国周末票房冠军如下:
  • 李元亮李元亮(?-1761年),镶黄旗汉军人。清朝政治人物。雍正七年(1729年)任正白旗汉军副都统。乾隆九年(1744)年升户部右侍郎,转户部左侍郎。乾隆十五年(1750年)任兵部尚书,先后署刑部、工部、礼
  • 塞法戴克斯塞法戴克斯(英语:Sephadex)是一个用于凝胶过滤的交联右旋糖酐凝胶的商标。在经杰克尔·波拉斯与泊·弗洛丁的研发工作后,它首次由法玛西亚于1959年上市。此名称源于:separation(分
  • 保罗·兰多斯基保罗·马克西米利安·隆德夫斯基(法语:Paul Maximilien Landowski,1875年6月4日-1961年3月27日),法国雕塑家。作品包括里约热内卢基督像、南京中山陵孙中山大理石坐像等。儿子是作
  • 石炭蜥目石炭蜥目(学名:Anthracosauria),是指一类已灭绝,像爬行动物及两栖动物的四足超纲,生存于石炭纪至二叠纪初期。不过其确切的分野则视乎不同的定义而决定。石炭蜥目最初于1934年由Gu
  • 闻庆市闻庆市(朝鲜语:문경시/聞慶市  */?),是大韩民国庆尚北道西北部的一个城市。面积911.73平方公里,2007年人口75,223人。1995年1月1日由店村市(점촌시)与闻庆郡(문경군)合并而成。
  • 白石益代白石益代,日本足球运动员,日本国家女子足球队成员。在1981年6月7日,她代表日本国家女子足球队出赛,在对战中华台北的比赛中首次​​亮相。1981年,他共为国家足球队出场4次。她也曾代表日本参加1981年亚足联女子亚洲杯。
  • 洪成昌洪成昌(韩语:홍성창),韩国电视剧导演。
  • 保罗·金恩·本尼迪克特保罗·金恩·本尼迪克特(英语:Paul King Benedict,1912年7月5日-1997年7月21日),汉名白保罗,是美国人类学家和心理专家。他也是语言学家,专注于研究东亚和东南亚的语言。他出生于纽约州波启浦夕市。1930年毕业于波基普西高中。1934年于新墨西哥大学取得文学士证书,其后于1935年和1941年分别在哈佛大学攻读硕士和以人类学系博士毕业。在纽约医学院取得医学士之后,成为一名精神科医师,服务于纽约州矫正署(New York State Department of Correction