ε-均衡

✍ dations ◷ 2025-12-02 15:25:10 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 元古宙元古宙(Proterozoic,符号PR),又称元古代、原生代,是地质时代中的一个时期,开始于同位素年龄2500Ma(百万年前),结束于542.0±1.0Ma。元古宙包括了古元古代、中元古代、新元古代。元古
  • 手术刀手术刀,在中文也常称柳叶刀,是根据它的形状来称呼的名字。是一种做外科手术时用来切割的一种医疗器械。一把手术刀由一个刀柄和一个刀刃组成,大部分都以不锈钢制造。刀刃可以有
  • 发射说人类对光学(optics)的研究开始于古代。最晚于公元前700年,古埃及人与美索不达米亚人便开始磨制与使用透镜;之后前6~5世纪时古希腊哲学家与古印度哲学家提出了很多关于视觉与光线
  • 万卫星万卫星(1958年7月-),中国空间物理学家。出生于湖北天门。中国科学院地质与地球物理研究所研究员。1982年毕业于武汉大学空间物理系,1984年获中国科学院武汉物理研究所硕士学位,198
  • 乌珂克图汗麻儿可儿(蒙古语:.mw-parser-output .font-mong{font-family:"Menk Hawang Tig","Menk Qagan Tig","Menk Garqag Tig","Menk Har_a Tig","Menk Scnin Tig","Oyun Gurban Ulus
  • 明正曹甫(15世纪-1512年),明朝正德年间起事领袖,保宁府(今四川阆中)人。正德四年(1509年),曹甫跟随顺天王蓝廷瑞、刮地王鄢本恕、扫地王廖惠,起兵反明。正德六年(1511年),自称顺天王,年号明正,攻
  • 伦敦卫生与热带医学院伦敦大学卫生与热带医学院(London School of Hygiene & Tropical Medicine,缩写:LSHTM)是一所位于伦敦的公立研究型大学,研究领域集中在公共健康和热带医学上,1899年由万巴德创建,
  • 木屐木鞋是鞋子的一种形式,也称为木屐,其中有许多也是凉鞋。是某些地区的传统文化之一,有时被当作艺术品,例如荷兰木鞋、日本的下驮等。中国传统的木屐,现在仍穿于如广东西部农村等偏
  • MY 101综合台MY 101综合台(MY 101)是群英社经营的高分辨率电视综合频道,主打与日本同步播送最新日本动画、精致日本电视剧。中华电信MOD遥控器按快速键“936”,或依步骤“MOD首页→戏剧→日
  • 西苏拉威西西苏拉威西省(印尼语:Provinsi Sulawesi Barat)是印度尼西亚苏拉威西岛西部的一个省,首府位于马穆朱。2010年人口普查,全省共有1,158,651人,2014年1月的官方估计全省共有1,284,620