无名氏定理

✍ dations ◷ 2025-04-26 01:24:44 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 变量在初等数学里,变量或变元、元是一个用来表示值的符号,该值可以是随意的,也可能是未指定或未定的。在代数运算时,将变量当作明确的数值代入运算中,可以于单次运算时解出多个问题。
  • 携带者带原者指受到传染病的感染或带有隐性(recessive)遗传疾病的不正常基因,却不表现症状的人。即使不受到疾病或基因可感染到的影响,他们仍能够将传染性疾病的病原体散播给其他个体
  • 伍德沃德罗伯特·伯恩斯·伍德沃德(英语:Robert Burns Woodward,1917年4月10日-1979年7月8日),美国有机化学家,对现代有机合成做出了相当大的贡献,尤其是在化学合成和具有复杂结构的天然有机
  • 联合国中文日联合国中文日(英语:UN Chinese Language Day)是联合国发起,在每年4月20日举行的纪念活动。联合国中文日是联合国在2010年所提出,目的是为了“庆祝多种语言以及文化的多样性,也提倡
  • 米底王国米底王国或米底亚王国(Median dynasty),又称玛代王国(Mādai),是一个以古波斯地区为中心的王国,领土面积最大时西起小亚细亚的卡帕多西亚,东至阿拉霍西亚西部。他们隶属印欧语系,是第
  • 菲尔多西哈基姆·阿波尔-卡西姆·菲尔多西·杜西(波斯文:حکیم ابوالقاسم فردوسی توسی‎,拉丁化:Hakīm Abol-Qāsem Ferdowsī Tūsī,935年—1020年)是广受尊重的
  • 罗马字日语书写系统汉字假名使用罗马字平文式罗马字(日语:ヘボン式ローマ字 Hebon-shiki Rōmaji ?)是一种使用罗马字母来为日语的发音进行标注的拼音方式,是幕末时代至日本行医的长
  • 查嗣庭试题案查嗣庭(17世纪-1727年),字润木,号横浦,浙江海宁袁花人。查嗣庭为查慎行之弟,康熙四十五年(1706年)中进士,选庶吉士,散馆授翰林院编修。雍正元年,由隆科多荐举,授内阁学士,又受蔡珽荐举,兼礼
  • 观察使观察使,中国古代官名,原称采访使,别称观察、廉车正使、廉车、廉使、廉查。唐玄宗设,原为一种监察官,近于御史,后变成军事、行政的官职。后人雅称明清的道员为观察使。唐初,常不定期
  • 精英在社会学及政治学中,精英(英语:elite),又作菁英、选良,是社会中的一小群人,他们拥有比一般人更优越的地位,控制了超过比例的财富以及政治权力。一般来说,精英是指具有强大社会力量的