ε-均衡

✍ dations ◷ 2025-11-25 15:03:57 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 挚诚协定英法协约,又名挚诚协定(英语:Entente cordiale),是指1904年4月8日英国和法国签订的一系列协定,它标志着两国停止关于争夺海外殖民地的冲突而开始合作对抗新崛起的德国的威胁。在协
  • 中山片广东省中山市沙溪、大涌、南蓢、三乡及火炬开发区等地;中山闽语是汉藏语系汉语族闽语支闽南语在广东省境内的一种方言,通行于古香山县之隆都、得能都、四大都、谷都和恭常都等
  • 鹩哥Gracula indica (but see text)鹩哥(学名:Gracula religiosa)是最善于学习人类语言的动物,又称之为又名了哥或九官鸟,据说一只年轻的鹩哥只需一星期便能学会一句简单的话。栖息在
  • 阿斯阿斯(as,复数形式 asses,圣经希腊语 Ασσαριων)是一种青铜币,后来成为铜币,此硬币使用于罗马共和国和罗马帝国,其名来源是同意异意的重量单位(12 unciae = 盎司),但是币值不受
  • 人人生而平等“人皆生而平等”(英语:All men are created equal),或译为人生而平等、人人生而平等,被称为一句“不朽的宣言”,并被认为是美国独立战争时期最具“持续影响力”的一句话。托马斯
  • 椅,无靠背的称为凳,是一件用来坐的家具,为脚物家具的一种 ,一般包括一个座位、椅背,有时还包括扶手,通常会有椅脚使座位高于地面。当椅子坐久后坐垫便会热。其他和椅相类似的东西
  • 祝福《祝福》是叶蒨文第五张粤语专辑,于1988年6月发行。《祝福》是叶蒨文非常突破性的一张专辑,销量高达七白金(即35万张)数字,成为全年之冠。主打歌《祝福》推出时适逢已故无线艺员
  • 巴黎条约 (1898年)巴黎条约(Treaty of Paris)是1898年12月10日美国和西班牙在美西战争后签订的和平条约。西班牙帝国因此条约丧失许多海外领土,美国则扩大在太平洋的影响力,逐渐取得和欧洲列强相
  • 381东北无名高地381东北无名高地战斗,联合国军称“Battle of Outpost Harry”,是朝鲜战争中1953年夏季进攻战役的一次战斗。美3师15团; 希腊营1953年6月10日21时30分,中国人民志愿军221团以其6
  • National Air and Space Museum国家航空和航天博物馆于1976年7月开馆,是全世界首屈一指的有关飞行的专题博物馆。座落在美国首都华盛顿特区的东南方,每月接待观众达10万之多,第一年的参观人数超过1000万人次,