ε-均衡

✍ dations ◷ 2025-04-26 10:47:03 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • DNA复制DNA复制是指DNA双链在细胞分裂分裂间期进行的以一个亲代DNA分子为模板合成子代DNA链的过程。复制的结果是一条双链变成两条一样的双链(如果复制过程正常的话),每条双链都与原来
  • 换气过度过度换气,又称过度呼吸(英文:hyperventilation),是由于过量的肺部通气导致二氧化碳不断排出,超过了身体产生二氧化碳的速率而发生 。如果经常发生过度换气的状况,则称之为过度换气
  • 罗伯特·莱夫科维茨罗伯特·莱夫科维茨(英语:Robert Lefkowitz,1943年4月15日-)是一位美国医学家,最出名的工作是关于G蛋白偶联受体,为此他赢得了2012年诺贝尔化学奖。他与布莱恩·科比尔卡分享这个奖
  • 葡语系奥林匹克委员会总会葡语系奥林匹克委员会总会(葡萄牙语:Associação dos Comités Olímpicos de Língua Oficial Portuguesa,简称葡语奥委会总会及ACOLOP) 于2004年6月8日成立于里斯本,目的为加
  • 磷脂酰乙醇胺磷脂酰乙醇胺(英语:phosphatidylethanolamines,简称 PE,俗称脑磷脂),与磷脂酰胆碱、磷脂酰肌醇、磷脂酸、磷脂酰丝氨酸等统称为广义卵磷脂。医学导航:遗传代谢缺陷代谢、k,c/g/r/p/
  • 鲸鱼座τf鲸鱼座τf(Tau Ceti f),即天仓五f,是一颗尚未确认的太阳系外行星,母恒星是类似太阳的鲸鱼座恒星天仓五,距离地球约11.905光年,是距离母恒星最远的行星。鲸鱼座τf自母恒星天仓五算
  • 简上仁简上仁(1948年3月5日-),是一位出生于台湾嘉义大林的民族音乐研究者。他长期致力于台湾本土音乐之采集、整理、创作及推展工作,于1983年成立“田园乐府”乐团并担任团长至今。1948
  • 苏树辉苏树辉(1951年-),汉族,中华人民共和国政治人物,澳门特区经济委员会委员、澳门博彩股份有限公司董事。第十一届全国政协委员。苏树辉擅于书法,并于1985年与其他志同道合人士创立非牟
  • 刊物出版物(出版、出版品)指以传播文化和知识为目的的各种产品包括印刷品、电子产品的总称,属于传播文化知识的媒体。分为书籍、期刊、报纸和电子传播产品(电子出版物或称电子书)等种
  • 朝阳县朝阳县是辽宁省朝阳市下辖的一个县。朝阳县境春秋时期为东胡地。战国和秦代时属辽西郡。西汉时属柳城、孤苏县地。东汉时属辽西郡柳城县地,东汉末为鲜卑族慕容部落占据。西晋