ε-均衡

✍ dations ◷ 2025-08-13 18:59:29 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 濒死经验濒死经验或临死经验是一种在接近死亡时一些人所经历的现象。这些现象包括灵魂出体、看见天堂或地狱、看见亲人、看见宗教人物或上帝、回顾一生的生活、极度的恐惧、完全的平
  • 经济地区俄罗斯经济地区(俄语:экономи́ческие райо́ны)是俄罗斯联邦的一种分区方式。俄罗斯全国按照以下基准,被分为12个地区。加里宁格勒州不属于任何经济地区,也
  • 图坦卡门图坦卡蒙(英语:Tutankhamun,埃及语:twt-ˤnḫ-ı͗mn,IPA: .mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode
  • 魁北克人党魁北克人党(法语:Parti Québécois),简称魁人党,是加拿大魁北克省的一个左翼省级政党。该党以魁北克独立为宗旨,并支持劳工运动。1968年由瑞内·勒维克创建,2007年起宝琳·马华担
  • 约瑟夫·格哈德·楚卡里尼约瑟夫·格哈德·楚卡里尼(德语:Joseph Gerhard Zuccarini,1797年8月10日-1848年2月16日),德国植物学家,慕尼黑大学植物学教授。他曾经帮助西博尔德整理和研究其从日本搜集的植物标
  • 宗室景麟宗室景麟(满语:ᡠᡴᠰᡠᠨ ᡤᡳᠩᠯᡳᠨ,转写:Uksun Ginglin,1773年8月20日-1844年7月28日,乾隆三十八年七月初三日辰时-道光二十四年六月十四日申时),字东圃。清朝远支宗室镶红旗第五
  • 爱尔兰广播电视台坐标:53°18′53″N 6°13′26″W / 53.31472°N 6.22389°W / 53.31472; -6.22389爱尔兰电视电台(爱尔兰语:Radio Telefís Éireann,简写为RTÉ)是爱尔兰共和国的公共广播公司,
  • 马斯科吉马斯科吉县(英语:Muskogee County, Oklahoma)是美国俄克拉荷马州东部的一个县。面积2,173平方公里。根据2010年人口普查,本县共有人口70,990人。本县县治为马斯科吉(Muskogee)。本
  • 华盛顿军区美国陆军华盛顿军区(英语: United States Army Military District of Washington,简称:MDW),是美国陆军的主要司令部之一,部署在华盛顿哥伦比亚特区。美国陆军华盛顿军区主要任
  • 大方县大方县是中华人民共和国贵州省毕节市下辖的一个县。位于贵州西北部,是面积3502平方公里,2006年人口为99万。邮政编码551600,县政府驻大方镇。大方县是对外开放县、国家扶贫开发