ε-均衡

✍ dations ◷ 2025-09-18 16:11:35 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 约瑟夫·里欧纳德·戈尔茨坦约瑟夫·里欧纳德·戈尔茨坦(英语:Joseph Leonard Goldstein,1940年4月18日-),美国生化学家与遗传学家,出生于南卡罗来纳州金斯特里。由于关于胆固醇的研究,而获得1985年的诺贝尔生
  • 波旁宫波旁宫(法语:Palais Bourbon)位于法国巴黎塞纳河左岸,对岸为协和广场,是法国国民议会(下议院)的所在。这座宫殿最初是为路易十四的女儿波旁公爵夫人而建,由意大利建筑师Lorenzo Giar
  • 陈云敏陈云敏(1962年2月-),浙江温岭人,土木工程专家,长期从事软弱土的静动力特性及处理技术和环境土工研究。2004年获得国家杰出青年科学基金,2005年当选浙江省特级专家。担任浙江大学建
  • 美女与野兽《美女与野兽》(法语:La Belle et la Bête)是一则传统童话,属于阿尔奈-汤普森分类法中的第425C类故事,即丈夫被施了魔法。故事的第一个出版发行版本出自法国作家加布里埃尔-苏珊
  • 财政经济政策财政政策 · 货币政策贸易政策 · 投资政策农业政策 · 产业政策能源政策 · 社会政策政策组合税收政策 · 预算政策政府收入 · 政府支出政府预算 · 赤字政府债
  • 高雄广播电台高雄广播电台,简称KBS广电,是台湾高雄市的一家公营广播电台,隶属高雄市政府新闻局,1982年6月28日开播。注2:台南地区电台,高雄部分区域可以接收到(主要是靠近台南市的北高雄地区) 注
  • 生物资讯生物信息学(英语:bioinformatics)利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机
  • 王德宝王德宝(1918年5月7日-2002年11月1日),江苏泰兴人,中国生物化学家。1940年毕业于国立中央大学。1951年获美国西部保留地大学博士学位。1951-1954年在美国约翰·霍普金斯大学从事博
  • Commonwealth共同体(英语:commonwealth),一个传统的英语名词,为一种政治共同体(community),为了促进共同的利益而成立。在传统上,它与共和主义(republicanism)同义,可被用来指单一的共和国,因此在这种
  • 士拉央参数所指定的目标页面不存在,建议更正成存在页面或直接建立下列一个页面(建立前请先搜寻是否有合适的存在页面可以取代):鹅唛县(马来语:Daerah Gombak),是马来西亚雪兰莪州中部的一