无名氏定理

✍ dations ◷ 2025-11-09 03:16:33 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 高尔加斯高尔吉亚(希腊文:Γοργίας,约公元前487年-前376年),希腊诡辩学派学者、前苏格拉底时期的哲学家及修辞学家,原居于西西里伦蒂尼。与普罗塔哥拉同为首批诡辩学者。他最为人所
  • 家畜胚胎学家畜胚胎学是胚胎学的一支,为研究家畜和家禽的胚胎的机理产生发展的学科。其研究范围包括家畜家禽是从受精到分娩或孵出之前,胚胎子宫或卵膜发育的过程。
  • 惠普惠烈-普克公司(英语:Hewlett-Packard Company、HP,简称惠普;NYSE:HPQ),是一间总部设在美国加州帕罗奥图的跨国科技公司。惠普公司主要研发,生产和销售笔记本电脑、一体机、台式机、平
  • 菌膜生物薄膜(英语:biofilm),也称作“生物膜”或“菌膜”,是一些微生物细胞由自身产生的胞外多聚物基质(英语:Extracellular polymeric substance)(主要为多糖)所包围而形成,且附着在浸有液
  • 扎明达尔扎明达尔(Zamindar)又译柴明达尔,波斯语“土地所有者”之意,是印度次大陆的世袭贵族。扎明达尔拥有大片土地和为他们耕作的农民,在东印度公司和英属印度时期有权向农民征税。政府
  • 徐 涛徐涛(1970年8月-),湖北宜昌人,中国细胞生物物理学家,中国科学院大学教授。曾任中国科学院生物物理研究所所长,2017年当选为中国科学院院士。1992年毕业于华中科技大学,1997年获得华
  • 达尔富尔达尔富尔(阿拉伯语:دار فور‎,意即“富尔人的国家”),位于非洲国家苏丹的西部地区,与中非共和国、乍得和南苏丹边境接壤。在行政区划上,该区被分为5个省,分别为南达尔富尔、东
  • 洛马米省洛马米省(法语:Province du Lomami)是位于刚果民主共和国南部的一个省,首府卡宾达,是卡宾达共和国流亡政府所在地,人口2,048,839(2015年),面积56,426平方公里。
  • 哈克尼车哈克尼车(hackney carriage),常简称cab,是计程车的一种。“carriage”一词是指马车车厢。更为高档的哈克尼车被称为“remise”。在英国,现在哈克尼车是指获得了政府许可经营的计
  • 斯洛文尼亚广播电视台斯洛文尼亚广播电视台(斯洛文尼亚语:Radiotelevizija Slovenija)是斯洛文尼亚的国家公共广播电视机构,总部位于卢比安纳,另外在科佩尔和马里博尔拥有地区广播中心。斯洛文尼亚广