ε-均衡

✍ dations ◷ 2025-12-01 07:42:14 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 立体渲染立体渲染(英语:Volume rendering),又称为体绘制,是一种用于显示离散三维采样数据集的二维投影的技术。一个典型的三维数据集是CT或者MRI采集的一组二维切面图像。通常这些数据是
  • 松果菊松果菊(学名:Echinacea purpurea),又名紫锥菊、紫锥花,是松果菊属下的一种多年生草本植物,原产于北美洲东部,是美国和加拿大安大略省常见的野外植物之一。松果菊可以长到120厘米(47
  • 英国地方自卫队本地陆军(Territorial Army),缩写TA,,或译地方自卫队,是英国陆军下辖的一支地面预备部队,同时也是英国军事组织中最大的预备力量,现编制有30000-35000官兵。本地陆军不是全职军人,其
  • 光源光通常指的是人类眼睛可以见的电磁波(可见光),视知觉就是对于可见光的知觉。可见光只是电磁波谱上的某一段频谱,一般是定义为波长介于400至700奈(纳)米(nm)之间的电磁波,也就是波长比
  • 薇拉·鲁宾薇拉·鲁宾(英语:Vera Rubin,1928年7月23日-2016年12月25日),婚前姓古柏(Cooper),美国天文学家,为研究星系自转速度的先驱。其知名的研究工作是发现了实际观察的星系转速与原先理论的
  • 大王乌贼巨乌贼,又名大王乌贼(属名:Architeuthis,英文名:Giant squid),是一种生活在太平洋和大西洋深海的乌贼,其天敌是抹香鲸,是世界上最长的无脊椎动物。 根据最新的估计,雌性乌贼的全长大约
  • 呼吸暂停呼吸中止、呼吸暂停(英文:Apnea)指的是呼吸完全停止。呼吸一旦终止,将不会有吸气及相关的肌肉动作且肺的体积将保持不变。端视呼吸道被锁死的程度与肺部跟外界环境的气流通气度
  • 台湾水库台湾境内之河川由于地势陡峻,河床比降极大,遇雨则山洪暴涨,泛滥成灾,逢旱则干涸见底,用水缺乏,唯一治本之道为兴筑水库水坝,以达到有效治理河川,蓄水,增加灌溉、发电、工业及公共给水
  • 李佳白李佳白(Gilbert Reid,1857年11月29日-1927年9月30日)美国在华社会活动家,尚贤堂创办人。1857年11月29日,李佳白出生于美国纽约州长岛,父亲是一位牧师。1882年,李佳白毕业于纽约协和
  • 新化县新化县位于中国湖南省中部、雪峰山东南麓、资水中游,地理坐标为北纬27°31′~28°14′,东经110°45′~111°41′,南北最长直线69公里,东西最宽直线83公里。全县总面积3635平方公