ε-均衡

✍ dations ◷ 2025-12-06 14:49:15 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 海陆腔海陆客家语,又称海陆片,是汉语族客家语的一个支系,主要分布在中国广东省汕尾市(海陆丰),以及台湾一些客家人社区。1987年版的《中国语言地图集》将其归入粤台片新惠小片,而2012年版
  • 哈密顿原理在物理学里,哈密顿原理(英语:Hamilton's principle)是爱尔兰物理学家威廉·哈密顿于1833年发表的关于平稳作用量原理的表述。哈密顿原理阐明,一个物理系统的拉格朗日函数,所构成的
  • 莱恩群岛莱恩群岛(英语:Line Islands),又译“线岛群岛”,是太平洋中部的一个群岛,主岛为圣诞岛,由11组环礁组成,其中8组环礁属基里巴斯,3组环礁是美国领地(贾维斯岛、金曼礁和巴尔米拉环礁)。该
  • 顿涅茨克人民共和国未受国际普遍承认国家 被顿涅茨克人民共和国(俄语:Донецкая народная республика,罗马化:Donetskaya narodnaya respublika)是乌克兰东部与俄罗斯接
  • 斋藤一斋藤一(1844年2月18日(天保十五年1月1日)-1915年(大正四年)9月28日)是日本武士(新选组队士),警官。阶级是警部。勲位为勲七等青色桐叶章。在幕末期新选组中,担任副长助勤,第三队组长,撃剑
  • 附着器附着器(英语:Appressorium)是真菌用于进入宿主细胞的特化细胞,用于感染寄主植物,可以紧密附着于寄主的不同结构或器官。附着器由胚芽管末端的发芽真菌孢子形成,孢子附着在植物表面
  • 南北朝时代南北朝是指1331年至1392年间日本历史上皇室分裂为南、北两个天皇的时代,位于镰仓时代与室町时代之间。在这段时间里,两方有各自的皇位承传,也各自有朝廷并立对峙。后嵯峨天皇由
  • 绍武绍武是南明绍武帝的年号,隆武二年(1646年)十一月绍武帝称帝后,预定于明年丁亥年(猪年,1647年)改元,十二月绍武政权覆亡,该年号实际并未使用。洪武 → 建文 → 永乐 → 洪熙 → 宣德
  • 淡水信义线.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none
  • 美国白宫白宫(英语:White House,也称白屋)是美国总统官邸与主要办公的地方,位于美国华盛顿哥伦比亚特区西北区,宾夕法尼亚大道1600号。自1800年美国第二任总统约翰·亚当斯入住以来,白宫就