惩罚函数法

✍ dations ◷ 2025-11-26 11:26:56 #最优化,运筹学

惩罚函数法(英语:penalty method)是求解有约束的最优化问题的一种算法。

惩罚函数法的要旨是将一个有约束的最优化问题转化为一系列的无约束问题;这些无约束问题由原问题及罚函数,再加上惩罚因子组成;而且,这些无约束问题的解会收敛于所求问题的解。

假设有以下有约束问题:

满足限制

惩罚函数法将问题转化成如下无约束问题的序列

其中

在上述方程, g ( c i ( x ) ) {\displaystyle g(c_{i}(\mathbf {x} ))} 称为外部罚函数, σ k {\displaystyle \sigma _{k}} 称为惩罚因子。在每一次迭代中,我们都增大 σ k {\displaystyle \sigma _{k}} (例如变为原来的10倍),然后求解该无约束问题。将每一次迭代的结果将组成一个序列,此序列的极限即为原约束问题的解。

图像压缩优化算法,可以利用惩罚函数以决定如何最优地将颜色域压缩成单个有代表性的数值。

障碍惩罚函数法同样是在源问题上加入一个与惩罚函数相似的函数项,构成一个解决有约束问题的替代算法。但在这种情况下,迭代将被限制于留在可行域内部,而障碍也将持续使迭代远离可行域的边界。

相关

  • 夏特雷剧院沙特雷剧院(法语:Théâtre du Châtelet)是位于法国首都巴黎第1区的一个剧院,有2500个座位。沙特雷剧院开始建设于1860年,在1862年竣工。
  • 分散体系分散系是将一种或一种以上的物质分散到另一种物质所形成的混合体系。前一种物质称为分散相,后一种物质称为分散介质。按照分散质微粒大小,分散系可分为三种:
  • 18电子规则18电子规则又称有效原子序数法则(EAN),是过渡金属簇合物化学中比较重要的一个经验规则,常用来预测金属配合物的结构和稳定性。过渡金属价电子层有5个(n)d、1个(n+1)s和3个(n+1)p
  • 雾霾霾(英语:haze,又称雾霾、烟霾、烟霞等)是一种由固体颗粒形成的空气污染,其核心物质是空气中悬浮的灰尘颗粒,气象学上称为气溶胶颗粒。霾中含有数百种大气化学颗粒物质,它们在人们毫
  • 昆士敦昆士敦是南非的城镇,位于该国东南部,由东开普省负责管辖,始建于1853年,面积114.94平方公里,每年平均降雨量514毫米,2001年人口20,196,人口密度每平方公里180人。
  • 林同骅林同骅(1911年5月26日-2007年6月28日),美国华裔航空工程师,结构工程师,工程力学家,预应力混凝土标准化开拓者。1911年出生在重庆,1912年随重庆电报局局长的祖父林福熙迁往福州。1914
  • 回响贝斯回响贝斯(英语:Dubstep),在1990年代诞生,源起英国伦敦南部的电子音乐,融合了牙买加搭乐和车库二步等旁系风格。音乐重点大多被形容成“紧密的制作与鼓的节奏两拍成一组,最早回电台
  • 德尔塔县 (密歇根州)德尔塔县(Delta County, Michigan)是美国密歇根州上半岛南部的一个县,南靠密歇根湖。面积5,158平方公里。根据美国2000年人口普查,共有人口38,520人。县治埃斯卡诺巴(Escanaba)。
  • 辻野晃一郎辻野 晃一郎(1957年7月10日-),生于日本福冈县北九州市,企业家,曾任Google公司日本分公司社长。1982年,毕业于庆应义塾大学。1984年,进入索尼公司。1988年,从加州理工学院取得电机工程
  • LyX L Y