无名氏定理

✍ dations ◷ 2024-12-22 21:36:24 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 富山大学富山大学富山大学(とやまだいがく,University of Toyama)位于富山县富山市五福3190番地的日本国立大学。富山大学是在1949年,由富山高等学校、富山师范学校、富山青年师范学校、
  • 加速期慢性粒细胞性白血病加速期慢性粒细胞性白血病(英语:Accelerated phase chronic myelogenous leukemia),是慢性粒细胞性白血病的加速期。在此阶段中,人体骨髓和血液中的细胞中有6%至30%是原始血细胞(b
  • 颜德岳颜德岳(1937年-)是一位中国高分子化学家。上海交通大学教授。1937年生于浙江永康。1961年毕业于南开大学化学系,1965年吉林大学化学系研究生毕业。2002年获比利时Leuven天主教大
  • 噻唑烷二酮类噻唑烷二酮类 (英语:Thiazolidinedione,TZDs) 于1990年代开始使用,主要用于治疗2型糖尿病尚在实验中的药物:Netoglitazone和Rivoglitazone早期发展但未上市之药品:Ciglitazone用硫
  • 气体扩散定律格锐目定律(英语:Graham's Law)说明定温定压时,气体的隙流速率与其气体微粒质量的平方根成反比。此定律由苏格兰化学家托马斯·格锐目于1831年在实验的基础上提出,其形式为:
  • 前卫金属前卫金属(Progressive metal,有时简写为Prog Metal)是重金属音乐的一个分支,融合前卫摇滚与重金属的音乐风格。前卫金属结合了强大的、吉他主导的金属音乐、复杂的编曲结构、奇
  • 苏联解体的预言有部分人和组织预测,苏联将在1991年前解体。有一部分政治家,如中国政治家邓小平、一部分苏联学者、美国学者布热津斯基,如邓小平曾经在1989年说,“东欧的事情”迟早会发生。。在
  • 斯波坎河斯波坎河(英语:Spokane River)是哥伦比亚河的一条支流,长约111英里(179千米),流经美国爱达荷州北部和华盛顿州东部,穿过斯波坎峡谷和华盛顿州的城市斯波坎。
  • 艾力·新关艾力·新关(英语:Eric Ken Shinseki,1942年11月28日-),是一名第三代日裔美籍军人,前任退伍军人事务部长,曾为第34任美国陆军参谋长,为首位晋升四星上将的亚裔美国人。出生于二战时日
  • 海军罪案调查处《海军罪案调查处》(原名:NCIS,是Naval Criminal Investigative Service的缩写)是美国哥伦比亚广播公司电视网的一部电视系列剧。内容是关于一组隶属于海军犯罪调查局(NCIS)的探员