ε-均衡

✍ dations ◷ 2025-12-03 17:22:20 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 萤光荧光(fluorescence)是一种光致冷发光现象。当某种常温物质经某种波长的入射光(通常是紫外线或X射线)照射,吸收光能后进入激发态,并且立即退激发并发出出射光(通常波长比入射光的的
  • 副族元素副族元素是化学上对元素的一种分类,是指周期表中不是s区及p区的元素,包括d区元素(过渡金属)、f区元素(镧系元素和锕系元素)等。若用旧的周期表分A族、B族的分类方式,副族元素为旧有
  • 膝关节脱位膝关节脱位是指股骨和胫骨之间的膝盖部位关节严重伤害的症状。症状包括膝盖疼痛(英语:Knee pain)及膝不稳。并发症包括膝盖附近动脉的受损(常见的部位是膝腘动脉(英语:Popliteal a
  • Bsub2/sub血栓素B2是血栓素A2的一种不活跃的产物,不像血栓素A2,其对血小板激活及血小板聚集没有影响。医学导航:遗传代谢缺陷代谢、k,c/g/r/p/y/i,f/h/s/l/o/e,a/u,n,mk,cgrp/y/i,f/h/s/
  • tachycardia心跳过速(tachycardia、tachyarrhythmia),也称心动过速、心跳过快。是指心跳速度超出了正常范围,达到每分钟一百次以上的现象。剧烈的体育运动、紧张、焦虑或服用某些药物等可能
  • 山海关之战八旗睿亲王多尔衮 山海关明军总兵吴三桂 辅国公赖慕布 八旗正白旗都统赖塔 范文程 豫亲王多铎 贝勒豪格闯王李自成 权将军刘宗敏 顾君恩抚清之战 · 萨尔浒之战 · 开铁
  • 广信广信是汉代岭南中心地,可能是梧州至封开一带,至今犹无定论。它是以汉武帝“初开粤地宜广布恩信”之“圣旨”命名,是监察岭南九郡的“交趾刺史部”所在地,以广信划分广东、广西。
  • 尚娜尚娜 是一位中国企业家、编剧。曾经担任《新京报》高级编辑,2006年加入搜狐担任娱乐频道主编,2009年担任搜狐视频高级总监,2011年担任搜狐视频内容运营中心总编辑。 2015年8月
  • 1957年1957年NBA选秀(1957 NBA draft)是国家篮球协会(NBA)的第十一次年度选秀。本次选秀于1957年4月17日举行,8支NBA球队轮流从美国大学篮球业余运动员中挑选新队员。在每一轮选秀中,各
  • 第六巡回美国联邦第六巡回上诉法院(引用时缩写为6th Cir.)是美国的13个联邦上诉法院之一。其对以下美国联邦地区法院拥有上诉管辖权:第六巡回上诉法院有16位现任法官,都位于俄亥俄州辛辛