无名氏定理

✍ dations ◷ 2025-12-03 05:36:31 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 庆生会生日指出生日或出生周年纪念的日子。一般来说,东亚人尤其关注家中年事已高的长者,他们的生日亦同样受重视;每一年的出生周年日都是一次家庭聚会,可以看作是一个家庭的节日。东亚
  • 喹唑啉酮喹唑啉酮(Quinazolinone)是喹唑啉的一类衍生物,通常指4-喹唑啉酮,是多种生物碱和药物的骨架结构。2-喹唑啉酮4-喹唑啉酮喹唑啉酮类催眠/镇静药物有4-喹唑啉酮的核心结构,其应用已
  • 迪奥克丽丝汀·迪奥(法语:Christian Dior),简称迪奥(Dior),是源自法国的国际奢侈品品牌,由法国时装设计师克丽丝汀·迪奥于1946年创立,总部位于巴黎。主要经营时装、配饰、香水、化妆品、
  • 和亲和亲,又可称和蕃,是指东亚君主将自己或宗室的女儿或国内其他女性嫁给他国君主以示两国友好,增进彼此关系,具有政治目的联姻。一个国家内部不同政治集团的联姻不算在内。中国的和
  • 政治自由政治自由,是一种政治思想、西方历史的核心概念,也是民主社会间最重要的(真实或理想)特征之一。构成政治自由理想的条件,根据政治光谱上各派别的团体和个人的立场不同,其所持看法也
  • 托马斯·赫尔维格汤马士·赫尔维格(丹麦语:Thomas Helveg,1971年6月24日-)是一名已退役的丹麦足球员,主要司职右后卫,亦曾担任防守中场。现为丹麦超级联赛球会欧登塞的助教。在足球生涯的高峰期,赫尔
  • 利率利率或利息率,是借款人需向其所借金钱所支付的代价,亦是放款人延迟其消费,借给借款人所获得的回报。利率通常以一年期利息与本金的百分比计算。利率是世界各国中央银行调节货币
  • 四甲基哌啶氧自由基2,2,6,6-四甲基哌啶-1-氧化物(TEMPO)是一种典型的哌啶类氮氧自由基。TEMPO 为橘红色升华结晶或液体,易溶于水和乙醇、苯等有机溶剂。有毒,具腐蚀性,可经皮肤吸收,有强烈刺激性。由
  • 雷伊汉勒雷伊汉勒是土耳其的城镇,由哈塔伊省负责管辖,位于该国南部地中海沿岸,毗邻与叙利亚接壤的边境,海拔高度158米,主要经济活动是农业和纺织业,2010年人口61,234。
  • 蕉岭县蕉岭县位于中国广东省东北部,韩江上游,属于梅州市管辖。东边和南边与梅县区相邻,西边与平远县相邻,北边与福建省龙岩市武平县、上杭县相邻。总面积为957平方公里。2002年人口为2