ε-均衡

✍ dations ◷ 2025-05-17 23:47:13 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • PAS染色法PAS染色法(Periodic Acid-Schiff stain)在组织学上,主要用来检测组织中的糖类,过碘酸把糖类相邻两个碳上的羟基氧化成醛基,再用Schiff试剂和醛基反应使呈现紫红色。通常用于霉菌
  • 处方缩写词列表处方缩写词列表是医学处方中常用的基于拉丁文术语的词头缩写。其中的大写、句点'.'的使用是可选的版式风格。列表中不包含处方中常见的药品的缩写。列表中红色条目是在美国
  • 准晶体准晶体,亦称为“准晶”或“拟晶”,是一种介于晶体和非晶体之间的固体。准晶体具有与晶体相似的长程有序的原子排列;但是准晶体不具备晶体的平移对称性。根据晶体局限定理(crysta
  • 高层大气大气物理学 大气力学(英语:Synoptic scale meteorology)天气 (分类) · (主题)气候 (分类) 气候变迁 (分类)高层大气物理学(英语:Aeronomy)是大气物理学的一个分支,主要研究中层与
  • tachycardia心跳过速(tachycardia、tachyarrhythmia),也称心动过速、心跳过快。是指心跳速度超出了正常范围,达到每分钟一百次以上的现象。剧烈的体育运动、紧张、焦虑或服用某些药物等可能
  • 斩首斩首,亦称砍头、杀头或开刀问斩,是死刑的一种,即将人的头部砍去。斩首的历史相当长,古代多国均有斩首的刑罚,与绞刑一类有相当长历史的刑罚一样。常用的斩首工具有:斧、剑、刀。在
  • 最佳女演员奖沃尔皮杯最佳女演员奖(意大利语:Coppa Volpi per la miglior interpretazione femminile)是由威尼斯电影节颁发的一座奖项。奖项由电影节评审团颁发,以表彰正式竞赛单元电影中有
  • 团体凝聚力团体凝聚力(英语:Group cohesiveness)在当一个社会群体内的成员与另一成员建立关系,并成为一个整体时就会出现。尽管凝聚力是一个多面的过程,它可以细分成四个部分:社交关系、工作
  • 路易斯安娜州路易斯安那州(法语:État de la Louisiane; 英语:State of Louisiana),简称路州,是美国的一个州,位于墨西哥湾沿岸。此州以对比强烈的文化、地理景观著名。如嘉年华会的狂欢和荒野
  • 尼泊尔执政党(50)反对派(9)国民议会(尼泊尔语:राष्ट्रिय सभा)是两院制的尼泊尔联邦议会的上议院。依据尼泊尔宪法第8、9部分设立,旨在向尼泊尔政府提出意见。每届6年,但期间每2