ε-均衡

✍ dations ◷ 2025-12-05 01:50:57 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 百人队会议森都利亚大会或百人队会议 (拉丁语:comitia centuriata)为古代罗马共和国三大投票会议之一。相传为第六代国王塞尔维乌斯·图利乌斯创立,参加该大会不分是罗马人民还是平民,凡是
  • 毛囊毛囊是用来生长毛发的皮肤器官,分布在除了手掌、脚掌和嘴唇以外的全身体表皮肤上。毛囊与皮脂腺相连,毛发密度越高的地方皮脂腺的数目就越多。毛囊还与一小束肌肉纤维相连,称作
  • 世界末日世界末日包括以下几种层次:
  • 珊布卡珊布卡(意大利语:Sambuca,意大利语发音:,英语:Sambuca)是意大利的茴香味力娇酒,通常为无色。最常见的演变品种有黑珊布卡(深蓝色)和红珊布卡(鲜红色)。珊布卡使用茴芹、八角、甘草等辛香
  • 捶丸捶丸是中国古代的一项球类运动,类似于现代的高尔夫球。捶丸,顾名思义,捶者打也,丸者球也,是中国古代球类运动项目之一。它的出现与盛行和唐代的球类活动有密切关系。唐代除了足踢
  • 威廉·珀金威廉·亨利·珀金爵士,FRS(英语:Sir William Henry Perkin,1838年3月12日-1907年7月14日),英国化学家。他在18岁发现了首个苯胺染料——苯胺紫。1853年15岁的珀金入读伦敦的皇家化
  • kʟ̝̊清软颚边塞擦音(Voiceless velar lateral affricate)是一种不寻常的辅音,被使用于一些口语中。其国际音标(IPA)表示为⟨kʟ̝̊⟩。此音见于一些高加索地区语言,并在一些南非和东
  • 中俄天津条约《天津条约》包括《中俄天津条约》、《中美天津条约》、《中英法天津条约》,是指公元1858年(清咸丰8年)清朝政府在第一次英法联军战败后与俄国、美国、英国、法国在天津海光寺
  • 朝鲜体育电视台朝鲜体育电视台(韩语:체육 텔레비죤)是朝鲜的一家电视台,也是朝鲜第五家电视台,2015年8月15日(朝鲜半岛光复70周年纪念日)开播,只在星期六和星期天播出节目。尽管此前朝鲜中央电视台
  • 马来纪年《马来纪年》(Sejarah Melayu;爪夷文: سجاره ملايو),原名《诸王起源》(Sulalatus Salatin),中文译名又作《马来由史话》。该书是著名的古马来文献,它的作者,一说是柔佛苏