ε-均衡

✍ dations ◷ 2025-11-21 20:49:15 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 光学显微镜光学显微镜(Optical microscope、Light microscope)是一种利用光学透镜产生影像放大效应的显微镜。由物体入射的光被至少两个光学系统(物镜和目镜)放大。首先物镜产生一个被放大
  • 纽约纽约都会区,也被称为三州地区,是全美国最大的都会区,也是全世界最大都会区之一,位于美国东北部。整个都会区以纽约市为中心,包括纽约州上州的六个郡与长岛的两个郡,新泽西州的十四
  • 亲美亲美(Pro-American)指在政治、经济、社会、文化各层面上对美国抱持亲近感的行为。对应词为反美。一些人认为美国、美国文化以及美国人在国际中起着积极、正面的作用,美国在国际
  • MoOsub3/sub三氧化钼是钼(VI)的氧化物,分子式为MoO3,是制取其它钼化合物的主要原料。它主要用作制取金属钼,以及催化很多有机反应,比如丙烯氨氧化制取丙烯腈。气态时,三氧化钼由MoO3分子组成,Mo
  • 翠雀碱翠雀碱(delphinine)是一种有毒的二萜生物碱,存在于翠雀属、灭虱草属、铁线莲属植物中。其结构与功效与乌头碱类似。
  • 爱德基金会爱德基金会(英语:The Amity Foundation)是与中国基督教协会有关联的团体,是中国的基督徒志愿者参加组成,主要帮助中国贫困地区的团体。本部在南京,活动概况主要包括从海外针对中国
  • 勃艮第酒红勃艮第酒红(英语:burgundy;法语:bourgogne)是红色系的一种颜色,因与法国勃艮第所出产的勃艮第酒颜色相似而得名。勃艮第酒红与栗色相似。勃艮第色是多个国家护照所采用的封皮颜色,
  • 耐克森轮胎耐克森轮胎有限公司(韩语:넥센타이어,英语:Nexen Tire Corporation)为韩国三大轮胎制造商之一,1942年于庆尚南道梁山市成立。耐克森轮胎于1956年8月起开始生产汽车辐射层轮胎,为韩
  • 梁赓义梁赓义(1951年9月7日-),台湾生物统计学家、教育家,现任国家卫生研究院院长。他1973年获国立清华大学学士学位,1979年获南卡罗莱纳大学统计所硕士学位,1982年获华盛顿大学生物统计博
  • 横扫江南七霸天《横扫江南七霸天》(英文:The 7 Tyrants of Jiangnan),又名《大小黄天霸》,由七小福:洪金宝、成龙、元彪、元华、元德、元奎、元武在童年时期主演的1962年电影,成龙以艺名元楼演出