ε-均衡

✍ dations ◷ 2025-12-09 16:21:50 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 来经月经(英语:menstruation, period, monthly,古代叫做癸水,俗称姨妈到、好朋友、大姨妈、来M等),是指女性血液或黏膜定期从子宫内膜经阴道排出体外的现象。高达80%女性曾表示在月经
  • 拉丁姆拉齐奥(拉丁语:Lătĭŭm)或被译作“拉丁姆”,是意大利中西部的一个区域,在那里罗马城建立并扩展至罗马帝国首都。 这里的居民在罗马王国被建立前使用的语言,即为拉丁文的前身。
  • 弗朗索瓦·布歇弗朗索瓦·布歇 (又译法兰撒·布歇或法兰克斯·布歇,法语:François Boucher,发音:/.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe U
  • 因果因果论(梵语:hetu-phala),在佛教中,是论述因缘业报(因hetu,缘paticca,业kamma,报vipaka或果phala)运作规律的学说,佛教认为因果法则是天然存在的,不会因为人认为不存在就不作用于此人。
  • 视网膜双极细胞双极细胞在视网膜中位于感光细胞(包括视杆细胞、视锥细胞)和神经节细胞(英语:Retinal ganglion cell)之间,直接或者间接地将信号由感光细胞传递到神经节。顾名思义,视网膜中的双极
  • γ-羧基谷氨酸γ-羧基谷氨酸(英语:γ-Carboxyglutamic acid)是一种非通用氨基酸,常见于蛋白质的翻译后修饰中的谷氨酸残基的羧基化。这种修饰方式存在于凝血因子及其它凝血级联相关蛋白质中,会
  • 大稻埕戏苑台北市艺文推广处,是台北市政府文化局的附属机构。
  • 张小月张小月(1953年2月12日-),中华民国资深外交官,无党籍,台湾彰化人,外省人第二代,籍贯中华民国浙江绍兴。前任外交部次长、北美事务协调委员会主任委员、陆委会主委,现任海基会董事长、
  • +3UTC+03:00时区比协调世界时快上3小时,包含以下区域:大部分俄罗斯的欧洲领土包括莫斯科、圣彼得堡、顿河畔罗斯托夫、新地岛, 法兰士约瑟夫地群岛。从2014年10月26日开始,莫斯科
  • 莱山区莱山区是中国山东省烟台市所辖的一个市辖区。莱山区辖初家街道、滨海路街道、黄海路街道、莱山街道、解甲庄街道、马山街道6个街道办事处。