无名氏定理

✍ dations ◷ 2025-11-30 05:38:17 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 社会市场经济社会市场经济(德语:Soziale Marktwirtschaft;英语:social market economy),为第二次世界大战后,德意志联邦共和国(西德)所采取的主要经济制度。第二次世界大战结束以来,联邦德国第一任
  • 生态系统理论生态系统理论(Ecological Systems Theory),有时也被称作背景发展理论或者人际生态理论,将人际关系分成了四套依次层叠的环境系统。这些系统彼此之间又相互影响。该理论由尤里·
  • 绍斯塔克杰克·威廉·绍斯塔克(英语:Jack William Szostak,1952年11月9日-),美国生物学家、霍华德·休斯医学研究所研究员、哈佛医学院遗传学教授、麻省总医院亚历山大·里奇杰出研究员。
  • 毒性弱化弱化子(attenuator,又译衰减子)是指原核生物的操纵子中可以明显衰减乃至终止转录作用的一段核苷酸序列,位于操纵子的上游。在研究大肠杆菌(E. coli)的色氨酸操纵子表达弱化现象时
  • 普利昂蛋白朊毒体(英语:prion,发音为/ˈpriː.ɒn/;又译为普利昂、蛋白质侵染因子、毒朊、感染性蛋白质、普恩蛋白等)是一种具感染性的致病因子,能引发人类及哺乳动物的传染性海绵状脑病。朊
  • 混沌模型在计算机界,混沌模型是一种软件开发的结构。其创始者曾使用 L.B.S.Raccoon 的笔名在这里(请帮助修正死链)指出,诸如螺旋模型和瀑布模型的项目管理模型虽然擅长于管理日程表和员
  • 芦粟糖高粱,俗名“甜杆”、“甜芦粟”或“芦穄”,属禾本科高粱属,指粒用高粱中茎含糖较多的品种。糖高粱形状同高粱类似,叶青灰色,茎杆中有含糖汁液。糖高粱对土壤和气候要求不严格,分
  • 宣皇后喜塔喇氏宣皇后(16世纪-1569年),昂果都理巴颜系喜塔腊氏出身,满洲译名额穆齐(满语:ᡝᠮᡝᠴᡳ,穆麟德:Emeci,太清:Emeqi。宣皇帝塔克世的嫡妻,清太祖努尔哈赤的生母。宣皇后是昂果都理巴颜长子都
  • 参赛国欧洲歌唱大赛自1956年创办以来,共有52个国家曾经参加比赛,其中有26个国家曾经获得冠军。欧洲歌唱大赛由欧洲广播联盟组织,每年由一个成员国负责主办。各参赛国的联盟成员广播公
  • 邵兵邵兵(1968年2月15日-),中国大陆男演员。1997年获第六届中国电影表演学会金凤凰奖、1998年凭《春天的狂想》获第五届中国电影华表奖优秀男演员奖。1989年考入北京电影学院,1993年