ε-均衡

✍ dations ◷ 2025-04-02 08:29:28 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 资优资优(英语:gifted)是指先天性的、异于平常的智能。这种趋势从出生开始在其整个生涯内均有体现。而这种趋势并非指世间一般所谓的对外的成功,而是指其内在的“掌握学习方法的天分
  • 拉丁文常用短语拉丁语短语列表(List of Latin phrases)以下是一些常用的拉丁文短语。拉丁语是罗马帝国的官方语言,现在欧洲的许多语言都含有拉丁语的借词。许多拉丁语词汇也是从古希腊文引入
  • 国内生产总额这是一份按照国内生产总值排列的经济体列表,是某经济体指定年份的经济中所生产出的全部最终成果(产品和劳务)的市场价值。这里的GDP是按照市场价值或政府官方汇率所估算,单位是
  • 时钟周期时间脉冲信号(英语:Clock signal),计算机科学及相关领域用语。此信号在同步电路当中,扮演计时器的角色,并组成电路的电子组件。只有当同步信号到达时,相关的触发器才按输入信号改变
  • 刺毛黧豆刺毛黧豆(学名:Mucuna pruriens)为豆科黎豆属下的一个种。直接接触表面的微细毛对人体的皮肤有很强的刺激性。
  • 洛东江洛东江(朝鲜语:낙동강/洛東江 Nakdonggang */?)为韩国最长河流,全长525公里,流域面积达23,384平方公里。水系发源于朝鲜半岛东侧之太白山脉,流经大邱和釜山两大韩国东南部都市,于
  • 沙功那空府 small(色军府)/small沙功那空府(泰语:จังหวัดสกลนคร,皇家转写:Changwat Sakon Nakhon,泰语发音:)是泰国东北部之一个府。华人称之为色军府。沙功那空府本属为老挝统治,至拉玛一世时代被暹
  • BBC世界新闻频道英国广播公司世界新闻频道(英语:BBC World News),是英国广播公司(BBC)的一条二十四小时新闻频道,于1995年1月正式启播。它在全球的主要竞争对手为CNN、天空新闻台和半岛电视台英语
  • 侨报《侨报》(英语:The China Press)是美国的一份中文报纸,自称“全美唯一简体中文日报”,为美国格律文化传媒集团下属媒体,隶属于中国国务院侨务办公室,立场较为倾向中华人民共和国政
  • 湘桂.mw-parser-output .RMbox{box-shadow:0 2px 2px 0 rgba(0,0,0,.14),0 1px 5px 0 rgba(0,0,0,.12),0 3px 1px -2px rgba(0,0,0,.2)}.mw-parser-output .RMinline{float:none