ε-均衡

✍ dations ◷ 2025-06-28 22:59:24 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 加勒比僧海豹加勒比僧海豹(学名:Neomonachus tropicalis),又名西印度僧海豹,是一种已灭绝的僧海豹。它们是唯一在加勒比海及墨西哥湾生活的海豹。最后确定观察到它们是于1952年在小塞拉纳岛。
  • 烧是烹调方法之一。是先将主料用煮、炒、煎、炸等方法烹熟后,加调味品和清汤,煮沸后用中到小火烧入味至酥烂,再旺火收汤。有的时候勾芡,不勾芡者称为干烧。烧的分类有:红烧、白烧
  • 敦化北路敦化北路是台北市最具代表性的林荫大道之一,属双向道路,全境位于松山区,北以过民权东路的台北松山机场为起点,南接敦化南路。
  • PDGF血小板衍生生长因子受体(Platelet-derived growth factor receptors,PDGF-R)为血小板衍生生长因子(PDGF)蛋白质家族的受体,位于细胞膜表面,属于酪胺酸激酶受体(英语:receptor tyrosin
  • 康广仁康有溥(1867年-1898年9月28日),字广仁,号幼博,又号大广,广东南海人,康有为之弟。参与戊戌变法,慈禧太后重夺权力后,因梁启超带病往北京应付官试,与他同行,因而被捕,和谭嗣同、杨锐、林旭
  • 无形文化遗产韩国重要无形文化遗产是韩国政府1964年以来由官方指定保护的无形文化遗产。1964年12月7日,宗庙祭礼乐成为第一个被列入重要无形文化遗产名单的无形文化。1995年,韩国文化财产
  • DDE1,1-双(对氯苯基)-2,2-二氯乙烯(DDE,滴滴伊)是滴滴涕(DDT)消除氯化氢后形成的化合物,是DDT的主要代谢产物之一。由于具有亲脂性,因此能储存于脂肪组织中并具有积累作用。有研究显示
  • 帕尔杜比采帕尔杜比采(捷克语:Pardubice,德语:Pardubitz,国际音标:  帮助·信息)是捷克共和国中部的一个城市,帕尔杜比采州首府,位于布拉格以东104千米的易北河畔。帕尔杜比采是一个工业城市,塑
  • 第四第四航空队(英语:Fourth Air Force)是美国空军预备役司令部下属的一个编号航空队,指挥部位于加利福尼亚州的March空军基地。
  • 纯色獴(S. concolor)纯色獴(学名Salanoia concolor),也叫棕尾獴,食肉目獴科的一种,只分布于非洲马达加斯加岛上。