ε-均衡

✍ dations ◷ 2025-11-29 17:53:07 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 免疫细胞免疫细胞(英语:immunocyte),泛指所有参与免疫反应的细胞,也特指能识别抗原,产生特异性免疫应答的淋巴细胞等。主要包括T淋巴细胞、B淋巴细胞、单核细胞、巨噬细胞、粒细胞、肥大细
  • 蛋白质蛋白质(英语:protein,旧称“朊”)是大型生物分子,或高分子,它由一个或多个由α-氨基酸残基组成的长链条组成。α-氨基酸分子呈线性排列,相邻α-氨基酸残基的羧基和氨基通过肽键连接
  • 吠陀文化吠陀文化(约前16世纪—前7世纪)是指吠陀经典所记载和反映的印度历史时期文化。透过吠陀经典的古梵文史料,所谓的吠陀经典即指四吠陀——梨俱吠陀、娑摩吠陀、夜柔吠陀、阿闼婆
  • 晋爵爵是中国传统一种用于饮酒的容器,从出土的形制来看,前有流(倾酒的流槽),后有尾,中有杯,一侧有鋬,下有三足,杯口有二柱。爵同时又是饮器的通称。爵在商代和的西周青铜礼器的考古发现中
  • 视紫质1eds, 1edx, 1f88, 1gzm, 1hzx, 1jfp, 1l9h, 1ln6, 1u19, 2g87, 2hpy, 2i35, 2i36, 2i37· protein binding · photoreceptor activity· photoreceptor outer segment
  • 卡洛夫期卡洛夫期(英语:Callovian)是侏罗纪的第八个时期,年代大约位于166.1–163.5百万年前。
  • 全罗全罗道(韩语:전라도)是昔日朝鲜八道之一,位于朝鲜半岛西南部,道府位于全州。始于高丽王朝,原称全罗州道 (전라주도)。15世纪简写为全罗道,道名由全州(전주)和罗州(나주/라주)合成。1895年,
  • 长征二号F型长征二号F火箭,简称长二F,别称“神箭”,缩写:CZ-2F 或 LM-2F,是长征二号家族中的最新改进型号,主要用于发射神舟系列载人飞船。长征二号F自1992年开始研制,1999年11月19日首次发射
  • 大白鹭Casmerodius albus (Linnaeus, 1758) Egretta alba (Linnaeus, 1758)大白鹭(学名:Ardea alba),别名白鹭鸶、鹭鸶、风漂公子、白漂鸟、冬庄。鹭科苍鹭属的一种。稻田、河岸、沙滩
  • 投票权法1965年的《选举法案》是美国联邦政府立法机构一个具有里程碑意义的片的法案,其禁止了在投票过程中的种族歧视。该法案保障了少数群体的投票权利、尤其是保障非裔美国人的投票