ε-均衡

✍ dations ◷ 2025-12-11 06:40:20 #ε-均衡

在博弈论中,ε-均衡(Epsilon-Equilibrium)是一个近似符合纳什均衡条件的策略组合,有时也称近似纳什均衡。

给定一个对策模型和一个非负实参数ε,一个策略组合被称为ε-均衡,当没有任何一个局中人能通过单方面改变他的策略而取得超过原先收益(Payoff)更多ε的收益。当ε=0时,每一个ε-均衡对应着一个纳什均衡。

从形式上来定义,令以下 G {\displaystyle G} 为N人对策模型:

G = ( N , A = A 1 × × A N ) {\displaystyle G=(N,A=A_{1}\times \cdots \times A_{N})} ,其中 A i {\displaystyle A_{i}} 为第 i {\displaystyle i} 个局中人的纯策略集, u : A R N {\displaystyle u:A\rightarrow \mathbb {R} ^{N}} 为效用函数。

当一组策略 σ Δ = Δ 1 × × Δ N {\displaystyle \sigma \in \Delta =\Delta _{1}\times \cdots \times \Delta _{N}} 满足以下条件时:

σ i Δ i , i N {\displaystyle \forall \sigma _{i}^{'}\in \Delta _{i},i\in N} ,有 u i ( σ ) u i ( σ i , σ i ) ϵ {\displaystyle u_{i}(\sigma )\geq u_{i}(\sigma _{i}^{'},\sigma _{-i})-\epsilon }

则称这个策略组合为该对策模型的一个ε-均衡。

ε-均衡的定义在随机博弈理论中可能出现的无限对策的情况下很重要,因为在一些简单的随机博弈的例子中,并没有纳什均衡点的存在,但有ε-均衡。


相关

  • 有孔虫界有孔虫界(学名:Rhizaria)为原生生物的一条主线。它们的形态差别很大,但主要部分均为变形虫状(amoeboid)并有丝状、网状或小管型支撑的假足。它们部分会制造可能有复杂结构的外壳或
  • 新政罗斯福新政(The New Deal)是指1933年富兰克林·罗斯福(小罗斯福)就任美国总统后所实行的一系列经济政策,其核心是三个R:救济(Relief)、复兴(Recovery)和改革(Reform),因此有时亦称三R新政
  • 鸭嘴兽鸭嘴兽(学名:Ornithorhynchus anatinus;英语:Platypus,偶称Duck-billed platypus)是原兽亚纲单孔目鸭嘴兽科鸭嘴兽属(Ornithorhynchus)的唯一一种动物。鸭嘴兽是少有的卵生哺乳动物,
  • 拉格朗日量在分析力学里,一个动力系统的拉格朗日量(英语:Lagrangian),又称拉格朗日函数,简称“拉氏量”,是描述整个物理系统的动力状态的函数,对于一般经典物理系统,通常定义为动能减去势能,以方
  • 印度哲学家印度哲学已具有近三千年的历史。印度哲学的发展可分为三个基本时期:在第一个时期,哲学思想逐渐从记录在人类最古老的文献—吠陀里的神话观念中分化出来。这一过程最集中地表现
  • 行政诉讼法行政法是法律中,有关国家行政权运作的国内公法总称。行政法的定义系由日本学者提出,在中文法律领域中广受引用。行政法涉及到行政机关执行职务时所适用之各项法律,在各法律部门
  • 罗密欧与茱丽叶《罗密欧与朱丽叶》(Romeo and Juliet),威廉·莎士比亚著名悲剧作品之一,因其知名度而常被误称为莎翁四大悲剧之一(实为《麦克白》、《奥赛罗》、《李尔王》及《哈姆雷特》)。戏剧
  • 哈斯汀法学院加利福尼亚大学哈斯汀法学院(University of California, Hastings College of the Law)是一所自1878年起在美国加州旧金山创设的法学院,附属于加州大学系统,也是其系统五所法学
  • 国立成功大学管理学院国立成功大学校务基金 20,518,898,000元国立成功大学(英语:National Cheng Kung University,缩写为NCKU),简称成大、成功大学,是一所位于台湾台南市的国立大学,该校是教育部高教深
  • 安德烈·滂尼发秀安德烈·滂尼发秀(他加禄语:Andrés Bonifacio,1863年11月30日-1897年5月10日),也译作博尼法西奥、波尼法秀、旁尼法秀等,是菲律宾军事家、政治家、菲律宾独立运动的发起人及主要领