ε-均衡

✍ dations ◷ 2025-07-15 05:22:22 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 汤飞凡汤飞凡(1897年7月23日-1958年9月30日),幼名瑞昭,湖南醴陵人,微生物学家,砂眼衣原体首次分离者。为第一个投身病毒学研究的华人。曾任中华医学会理事、中国国家菌种保藏委员会主任委
  • 线形文字A线形文字A是一种古代克里特岛上使用的未解读文字。它的破解是考古学上的“圣杯”。它的一种关联文字,线形文字B于1950年被迈克尔·文特里斯破译,证明其为希腊语的一种古代书写
  • 论文论文是科学或者社会研究工作者在学术书籍或学术期刊上刊登的,用来进行科学研究和描述或呈现自己研究成果的文章。论文往往强调原创性的工作总结,但当然也可以是对前人工作总结
  • 关联在概率论和统计学中,相关(Correlation),显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许
  • 塞尔维亚第纳尔塞尔维亚第纳尔 (塞尔维亚语:динар,复数динари),是塞尔维亚的法定货币。一第纳尔下分100帕拉 (para)。目前流通的版本首发于2003年7月2日。原为塞尔维亚一自治省的科索
  • 克里斯汀·阿芒托克里斯汀·阿芒托(法语:Christian Amatore,1951年12月9日-),法国化学家,法国科学院院士。2013年当选为中国科学院外籍院士。克里斯汀·阿芒托主要在电分析化学和生物电化学领域以及
  • cnBetacnBeta.COM(被网民简称为CB、cβ),官方自我定位“中文业界资讯站”,是一个提供IT相关新闻资讯、技术文章和评论的中文网站。其主要特色为游客的匿名评论及线上互动,形成独特的社
  • 全新世纪年全新世纪年或人类纪年(Holocene calendar或Human Era),与公元相对应,简称人元(HE),是一种由现时采用的公历(即格里历)改良而来的纪年方法,它引入0年,并在公历年数上多加 10000 。例如公
  • 羟化酶羟化酶(Hydroxylase)也称羟基化酶、氢氧化酶,是一类催化羟基化反应的加氧酶,多以氧气为氧源,催化形成含羟基的产物,如醇、酚。
  • 现实政治现实政治(德语:Realpolitik)源自十九世纪德国,由普鲁士王国首相奥托·冯·俾斯麦提出,当代英文相关讨论沿用德文之Realpolitik。现实政治主张,当政者应以国家利益做为从事内政外交