ε-均衡

✍ dations ◷ 2025-11-23 10:46:10 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 甲烷甲烷(化学式:CH4;英语:Methane),是结构最简单的烷类,由一个碳原子以及四个氢原子组成。它是最简单的烃类也是天然气的主要成分。甲烷在地球上有很高的相对丰度,使之成为很有发展潜力
  • DICOM医疗数位影像传输协定(DICOM,Digital Imaging and Communications in Medicine)是一组通用的标准协定,在对于医学影像的处理、储存、打印、传输上。它包含了档案格式的定义及网
  • 实验室芯片实验室芯片(Lab-on-a-chip)是泛指能整合多种化学、生物分析功能于单一小型芯片上,处理非常微小液量(不到数皮升, picoliter)的技术,有时又称微型全分析系统(Micro Total Analysis
  • 水杨酸类药物水杨酸(英语:Salicylic acid,源于拉丁文的“杨柳” salix),又名柳酸、邻羟基苯甲酸、2-羟基苯甲酸。水杨酸易溶于乙醇、乙醚、氯仿、苯、丙酮、松节油,不易溶于水,20°C时溶解度为
  • 松锦之战皇太极抚清之战 · 萨尔浒之战 · 开铁之战 · 辽沈之战 · 镇江之战 · 林畔之战 · 广宁之战 · 辽南之战 · 亮马佃大捷 · 牛毛大捷 · 乌鸡关大捷
  • 全罗全罗道(韩语:전라도)是昔日朝鲜八道之一,位于朝鲜半岛西南部,道府位于全州。始于高丽王朝,原称全罗州道 (전라주도)。15世纪简写为全罗道,道名由全州(전주)和罗州(나주/라주)合成。1895年,
  • 第二次泰法战争1940至1941年,泰国和维希法国之间因为对法属印度支那(Indochine française)的某些原属泰国的地区的所有权发生争持,从而爆发了小规模的泰法战争。早在二战爆发之前,两国政府有为
  • 新型冠状病毒感染应变协调中心新型冠状病毒感染应变协调中心是澳门特别行政区政府为了因应新型冠状病毒感染疫情的进一步发展,于2020年1月21日举行新闻会宣布成立的机构。协调中心直接隶属行政长官运作,由
  • 桑顿市桑顿(英语:Thornton, Colorado)是美国科罗拉多州的一个城市,位于州府丹佛以北。行政上大部分属于亚当斯县,余属韦尔德县。面积70.4平方公里,2006年人口109,155人,是该州第六大城市
  • 义务义务(英语:duty),指应尽的责任,应该要做的事。义务可能来自于宗教、伦理道德、社会关系、法律等规定。这个名词译自英语:Duty。最早源自拉丁语:debere或debitum,本来是指债务,变成古