ε-均衡

✍ dations ◷ 2025-11-24 12:27:29 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 多聚腺苷酸化多腺苷酸化(英语:Polyadenylation)是指多聚腺苷酸与信使RNA(mRNA)分子的共价链接。在蛋白质生物合成的过程中,这是产生准备作翻译的成熟mRNA的方式的一部分。在真核生物中,多聚腺苷
  • 火焰崇拜火焰崇拜,是人类历史上不同时期对火的崇拜。火被视为神圣,清除不洁、善与智慧的象征。南亚伊朗地区的祆教来自于上古希腊人的火焰崇拜,火被视为清浄、正义、真理。在古印度,火是
  • 玛琪雅朵咖啡古罗马 · 中世纪 · 文艺复兴 · 现代威尼斯和威尼托 · 托斯卡尼 · 西西里 · 维琴察 · 罗马 (罗马饮品) · 那不勒斯面包 · 奶酪 (PDO) · 油酥糕点 ·
  • 僵直性脊椎炎强直性脊柱炎(拉丁文:spondylitis ankylosans,其中spondylitis原为希腊文脊柱炎之意,ankylosans原系希腊文强直之意),又称僵直性脊椎炎,在欧陆亦称此病为白赫铁列夫症(Morbus Bechte
  • 人造板人造板是由以木质材料或其他植物纤维为主要原料,通过专门的加工工艺,在一定的条件下压制而成的板材或型材。 按照不同工艺流程,主要分为胶合板、刨花板、纤维板和复合人造板。
  • 彦根藩彦根藩(日语:彦根藩/ひこねはん Hikone han */?)是日本江户时代的一个藩。位于近江国北部(今滋贺县彦根市)。藩厅是彦根城(当初配置时是佐和山城)。藩主是井伊氏。支藩是彦根新田
  • 蜜月期度蜜月,又称为蜜月旅行,是新婚夫妻一起到某一个地方所度过的休闲时光。蜜月旅行的要点,在于行程浪漫之余,亦不失个人的空间。因此,若非必要而要参加旅行团的话,也希望观光的地点能
  • 青岛前湾港区2号疏港高速公路青岛前湾港区2号疏港高速公路,简称青岛前湾港区2号疏港高速,高速公路网编号为S7602,是中国青岛市黄岛区连通青岛前湾港的一条疏港高速公路,全长26.146km,双向四车道,设计时速120公
  • 边际主义边际主义在经济学中指由边际效用和边际成本(参看:边际)发展而来的经济学理论。边际效用理论是在1870年左右,是由英格兰的威廉姆·斯坦利·杰文斯、奥地利的卡尔·门格尔和瑞士的
  • 威廉·鲍莫尔威廉·杰克·鲍莫尔(William Jack Baumol,1922年2月26日-2017年5月4日),美国经济学家,纽约大学经济学系教授,同时也是普林斯顿大学教授。他做了大量有关劳动市场和其他影响经济之要