ε-均衡

✍ dations ◷ 2025-01-31 10:30:00 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 肾小体肾小体(英语:renal corpuscle)位于肾脏,是肾单位中首先进行过滤工作的单位,它包含了由动脉性微血管组成的肾小球,并被囊状的鲍氏囊包围起来。经超滤作用后,来自肾小球血细胞中的液
  • 王政时期罗马王政时代或罗马王国(拉丁语:REGNVM ROMANVM)是指前753年到前509年这一时期的古罗马,此时的罗马是一个君主制国家,尚未建立共和国。罗马王国时期,氏族部落组织尚完整存在,统治阶
  • 植物激素植物激素(Plant hormone),又称植物荷尔蒙,是一些在植物体内合成,可以从产生部位输送至作用部位,微量浓度即可对植物体产生某种生理作用的活性有机物。植物激素能由产生部位运输至
  • LGBT相关电影涉及同性恋、双性恋与/或跨性别话题的电影,塑造了重要的同志角色和/或把同性恋、双性恋以及/或跨性别身份或关系作为一个重要的剧情的有:
  • 土卫六土卫六又称为“泰坦”(Titan),是环绕土星运行的一颗卫星,是土星卫星中最大的一个,也是太阳系第二大的卫星。荷兰物理学家、天文学家和数学家克里斯蒂安·惠更斯在1655年3月25日发
  • 模式标本正型标本(英语:Holotype)是多个可能的生物型中的一个。一个生物型是把一个名称归为一个分类单元。正型标本是一个种被第一次描述的时候所使用的单一物种个体。它可以是一个单一
  • 白厅白厅(英语:Whitehall;又译怀特霍尔)是英国伦敦威斯敏斯特市内的一条大道,自特拉法加广场向南延伸至国会广场,亦为英国A3212号公路(特拉法加广场至切尔西)的首段。白厅是英国政府中枢
  • 纬来戏剧台纬来戏剧台,是纬来电视网旗下以播放戏剧为主的频道。本段时间均以二十四小时制东八区时间(UTC+8)为准。节目表
  • 国家广场坐标:38°53′24″N 77°01′25″W / 38.89000°N 77.02361°W / 38.89000; -77.02361国家广场(英语:National Mall)是位于美国首都华盛顿特区的一处开放型国家公园。该广场由数
  • 领獴领獴(学名:Herpestes semitorquatus)是食肉目獴科的一种,分布于东南亚的婆罗洲,曾被认为与短尾獴(Herpestes brachyurus)为同种。