ε-均衡

✍ dations ◷ 2024-09-20 12:35:47 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 拉br /伸br /纪拉伸纪(Tonian,符号NP1)又名青白口纪,是地质时代中的一个纪,开始于同位素年龄1000±0百万年(Ma),结束于720±0Ma。拉伸纪期间首次出现大型具刺疑源类,并形成臭氧层。拉伸纪属于前寒武
  • 邢定钰邢定钰(1945年2月-),生于上海,籍贯江苏南京,中国物理学家,南京大学教授。现任南京大学微结构国家实验室(筹)主任。1967年毕业于南京大学,1981年在该校获硕士学位。2007年当选中国科
  • 东京奥运会除特别注明外,本文所有时间均以东九区时间(UTC+9)为准。本条目记叙2019冠状病毒病疫情对第32届夏季奥林匹克运动会的影响。受疫情影响,众多东京奥运会预选赛延期或被取消。2020
  • 砷元素3d104s24p32, 8, 18, 5蒸气压第一:947.0 kJ·mol−1 第二:1798 kJ·mol−1 第三:2735 kJ·mol−1 (主条目:砷的同位素砷(Arsenic),化学元素符号为As,原子序数为33。砷分布在多种
  • 藏狐藏狐(Vulpes ferrilata)为狐属下的一种生物,分布于青藏高原。中型狐类,成年个体体长60至70厘米(24至28英寸),体重4至5.5千克(8.8至12.1英磅),尾长29至40厘米(11至16英寸)。背部为棕黄色,
  • 小苹果苹果属(学名:Malus)为蔷薇目蔷薇科的一属,计有30到35个不同的品种。亦有其他文献指苹果属之下的品种多达55种。苹果属植物原生于北半球的温带地区,在欧洲、亚洲及北美洲皆有发现
  • 六经四配颜回 · 孟子 · 曾参 · 孔伋日本藤原惺窝 · 林罗山 · 室鸠巢新井白石 · 雨森芳洲朝鲜薛聪 · 权近 · 吉再 · 安珦 · 李穑李滉 · 王仁 · 李齐贤 
  • 原日军台南卫戍病院原日军台南卫戍病院位于台南市东区,于民国九十二年(2003年)6月18日公告为台南市市定古迹,为全台湾仅存的完整军医院建筑群。该建筑目前为国立成功大学台湾文学系系馆。台南卫戍
  • 田代岛田代岛(日语:田代島/たしろじま Tashirojima */?)是日本的一个岛屿,隶属宫城县石卷市,位于牡鹿半岛以西。该岛总面积3.14km²,海岸线总长11.5km。岛上最高峰为正岛山,海拔约96米。
  • 伍世文伍世文(1934年7月24日-),中华民国海军二级上将退役,生于广东省台山海宴那马村,打过金门八二三炮战,为中华民国国军留美将领之一。伍世文随父亲伍根华到台湾后就读桃园县立中坜中学,