ε-均衡

✍ dations ◷ 2025-09-06 07:33:27 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 异麦芽糖异麦芽糖是一种二糖,类似于麦芽糖,但拥有α-(1-6)-糖苷键,而不是麦芽糖的α-(1-4)-糖苷键。可水解为两个葡萄糖分子。 麦芽糖浆在转葡糖苷酶(英语:transglucosidase) (TG,也称α-葡
  • 克罗托内克罗托内(意大利语:Crotone )也称克罗顿(意大利语:Croton),是位于意大利南部卡拉布里亚大区,爱奥尼亚海沿岸的一个城市。在1994年,克罗托内成为新成立的克罗托内省的首府所在地。目前
  • 钠钾合金钠钾合金是钠(Na)和钾(K)的合金,英文写作NaK,常发音成'knack'。值得注意的是它在室温下为液态。市场上有不同级别的钠钾合金出售。钠钾合金与空气和水剧烈反应,使用时必须注意。即
  • 印度电影印度是重要的电影出产地区。印度的电影产量是世界之冠(2002年出产1200套电影),主要应付国内庞大的需求。印度电影在住有大量印度移民的国家也很受欢迎。1950年代到1990年代,绝大
  • 1593年重要事件及趋势重要人物
  • 1691年重要事件及趋势重要人物
  • 枪乌贼鱿鱼、学名是“开眼亚目”,又称句公、枪乌贼、鱿鱼亚目,是软体动物门头足纲鞘亚纲十腕总目管鱿目开眼亚目动物的通称。鱿鱼身体细长,呈长锥形,有十只触腕,其中两只较长。触腕前端
  • 厦深铁路.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none
  • 路易斯·斯科拉路易斯·阿尔伯托·斯科拉(西班牙语:Luis Alberto Scola,1980年4月30日-),阿根廷职业篮球运动员,出生于布宜诺斯埃利斯,拥有阿根廷和西班牙双重国籍。阿根廷国家男子篮球队主力中锋,
  • 银牌银牌通常是奖励给某项竞赛(例如奥运会等体育比赛)第二名优胜者的奖牌。竞赛的一、三名优胜者一般是分别获得金牌和铜牌。这种做法据说是由一位犹太人的国王首创的。银牌通常都