ε-均衡

✍ dations ◷ 2025-12-04 12:19:24 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 绿球藻绿球藻可能指以下其中一项:
  • 日本清酒日本酒(日语:日本酒/にほんしゅ Nihon syu),指日本传统的酒精饮料,一般用来特指日本最具代表性的酒类,清酒。主要以米为原料,以日本传统制法制成,属于酿造酒。以日本特有制法制成的
  • 上郡上郡为战国时期魏国所置。秦惠王十年(前328年),魏国献上郡15县与秦,为秦初三十六郡之一,郡治肤施县(在今陕西省榆林市南)。西汉、东汉时沿置,郡治未变。汉灵帝末,因羌胡大扰而迁徙,曹
  • 巴拉瑞特巴拉瑞特(Ballarat),早期中文亦称“孖辣”,位于澳大利亚维多利亚州中部高地(英语:Central Highlands (Victoria)),是距离墨尔本西北方105千米(65英里)的一座内陆观光城市,人口101,588(20
  • 政府开发援助政府开发援助(英语:Official Development Assistance,缩写为ODA;又称政府发展援助、官方发展援助)是发达国家对发展中国家的一种经济援助。根据经济合作与发展组织(OECD)开发援助委
  • 乙醘辅酶A乙酰辅酶A(英语:acetyl-CoA)是激活了的乙酸,由乙酰基(CH3CO-)与辅酶A的巯基以高能的硫酯键相连。乙酰辅酶A是脂肪酸的β-氧化及糖酵解后产生的丙酮酸脱羧后的产物。在三羧酸循环的
  • 大邱体育场大邱世界杯体育场是位于韩国大邱市的足球场。1997年7月,球场正式动工兴建;2001年5月完工,同年6月28日开放。成本为USD$2亿6千5百万。球场曾为K联赛球队FC大邱的主场,可以容纳65,
  • 泰达学院校区泰达学院是南开大学的一个分部,学院座落在天津经济技术开发区第三大街,由南开大学和天津经济技术开发区管理委员会共同投资于2000年建成第一期工程。泰达学院学生包括南开大学
  • 东风卫视东风卫视(Azio TV、Asia Plus)是台湾年代集团旗下所属频道,分为台湾台与亚洲台两个版本。公司全名为东风文化传播事业股份有限公司,2012年起由“卫星娱乐传播股份有限公司”所经
  • 威尔玛飓风飓风威尔玛是2005年大西洋飓风季第二十一个热带风暴,同时又是第十二个飓风,同时平了这两个纪录。(但后来修定为十三个飓风)飓风威尔玛也是此飓风季中第三个五级飓风(后来艾米莉飓