ε-均衡

✍ dations ◷ 2025-11-23 21:18:04 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 毒鹅膏蕈伞凸面毒鹅膏,包括东亚的黄盖毒鹅膏菌(拉丁学名:Amanita subjunquillea)的和欧洲的黄绿毒鹅膏菌(拉丁学名:Amanita phalloides),为两种具有极近亲缘关系、外表无法区分的剧毒担子
  • 民系汉族民系指的根据语言、文化以及地域特征而划分的汉族支派(支系),除了汉族外,世界上其他民族内部也有不同支系。在20世纪以前,对汉族内部差异性的研究极少。直到1930年,客家学者罗
  • 洛歇L-1011洛克希德三星(Lockheed L-1011 TriStar)是一款中长程,宽体三发动机喷气机。它是继波音747和DC-10后,第三款投入商业运营的宽体喷气客机,亦是洛克希德公司的唯一一款喷气民航客机
  • 段祺瑞段祺瑞(1865年3月6日-1936年11月2日),原名启瑞,字芝泉,中国安徽合肥(今属肥西县)人,为中华民国政治家,皖系军阀首领,曾三次出任国务总理,1916年至1920年为北洋政府的实际掌权者和领导人
  • 刺史,中国古代职官名,本为御史的一种,始于汉代,东汉末年三国时期又有州牧一职与之类似。其等级和职权范围随朝代不同而多有变迁,但经常是各地方重要官员。“刺”是检核问事的意思
  • Macrorhynchus大头鳄属(学名:Pholidosaurus)是鳄形超目新鳄类大头鳄科的一属,是大头鳄科的模式属。化石发现于德国、英格兰,生存年代估计约为白垩纪早期的贝里亚阶。发现于瑞典斯科讷、丹麦博
  • 耶路撒冷综合症耶路撒冷综合征是一种由于访问耶路撒冷城而触发的精神现象,包括一些宗教主题的激烈的思想困扰、错觉或其他类似精神病的体验。它并不局限于某一种宗教或教派,犹太人和许多不同
  • 萨尔塔坐标:24°47′S 65°25′W / 24.783°S 65.417°W / -24.783; -65.417萨尔塔(西班牙语:Salta)位于阿根廷西北部安第斯山脉脚下,是萨尔塔省的首府,人口464,678(2001年)。
  • 陈佩斯陈佩斯(1954年2月1日-),号曝日堂主人,籍贯河北宁晋,出生于吉林农安,中国喜剧演员,小品和舞台剧演员,中国广播艺术团一级演员,中国电影家协会原理事。电影表演艺术家陈强之子。改革之初
  • 纳西姆·尼可拉斯·塔雷伯纳西姆·尼可拉斯·塔雷伯(阿拉伯语:نسيم نيقولا نجيب طالب‎,英语:Nassim Nicholas Taleb,1960年1月1日-),黎巴嫩裔美国人。知名思想家,经验主义、怀疑经验论者,金