无名氏定理

✍ dations ◷ 2025-04-04 06:40:34 #无名氏定理

在博弈论中,无名氏定理(英语:folk theorem)是一类描述重复博弈纳什均衡的定理。起初,无名氏定理仅关注无穷博弈的纳什均衡。在20世纪50年代,这类定理已经广受博弈论学者知晓,但并没有人发表它,所以称为无名氏定理。1971年发表的Friedman定理考虑了无穷博弈的一系列子博弈精炼纳什均衡(英语:Subgame perfect equilibrium)(SPE),把定理的初始版本推广到了更强的均衡概念上。

无名氏定理指出,如果参与者对未来足够有耐心(也即贴现因子 δ 1 {\displaystyle \delta \to 1} ),对于任意可行、满足个人理性假设的一组收益 v = ( v 1 , , v n ) {\displaystyle v=(v_{1},\cdots ,v_{n})} ,都存在着一个子博弈精炼纳什均衡,使得第 i {\displaystyle i} 个参与者的平均收益就是 v i {\displaystyle v_{i}} 。换言之,任何程度的合作(只要是可行的且满足个人理性)都可以通过一个子博弈精炼纳什均衡来达成。

例如,在只有一期的囚徒困境中,两个参与者都选择合作并非纳什均衡,唯一的纳什均衡就是两个人都选择背叛。根据无名氏定理,如果囚徒困境重复无穷多次,并且参与者足够有耐心,就会存在两个参与者都合作的纳什均衡。但在有限期囚徒困境中,最后一期一定会双方都背叛,从而倒数第二期双方也会背叛,以此类推,唯一的子博弈精炼纳什均衡就是双方一直背叛,不会有合作出现。

重复博弈中的纳什均衡应该满足以下两个性质:

无名氏定理有若干种,有些考虑有限重复博弈,有些考虑无限重复博弈。

在不考虑贴现的无穷博弈中,参与者都是有耐心的。在任何时间点,相同的效用带来的收益都是相同的。所以在无穷博弈中,每个参与者的收益就等于每一期博弈获取效用的总和。

就无穷博弈而言,总收益的计算通常是平均效用取极限以后的下确界。假设第 t {\displaystyle t} 期参与者 i {\displaystyle i} 选择的行动是 x t {\displaystyle x_{t}} ,那么他的总收益就是:

其中 u i {\displaystyle u_{i}} 表示每个阶段博弈中,参与者 i {\displaystyle i} 的效用函数。

这种情况下,无名氏定理指出:阶段博弈中满足个人理性且可行的行动在无穷博弈中都是纳什均衡。

考虑冷酷战略(英语:Grim trigger)。所有参与者都按照预定的策略进行每一期博弈。如果在某一期中有人没有使用预定策略,从下一期开始所有人永远选择让这个人只能拿到最小最大收益的策略。这样,出偏差的人的总收益也只能是最小最大收益,所以所有人都愿意按照预定策略行事。:139

上述纳什均衡不一定是一个子博弈精炼均衡。如果实施惩罚对其他人的收益影响也很大,那么惩罚就是不可信的。

要想达到子博弈精炼均衡,每次有人偏离预定策略时,惩罚不应该一直实施下去,而只应持续到出偏差的人在那一期博弈带来的额外收益得到抵消为止。之后,大家依旧按照预定策略继续博弈。:146–149

因为计算总收益的方法是平均收益取极限,所以有限期的惩罚并不会影响总收益。这样,这就是一个子博弈精炼纳什均衡。

设贴现因子 δ {\displaystyle \delta } 满足 0 < δ < 1 {\displaystyle 0<\delta <1} ,无穷博弈的总收益为:

贴现因子的大小反映出参与者的耐心高低。

这种情况下的无名氏定理指出,每个人的总收益将严格大于最小最大收益。

相关

  • 沃尔夫冈·潘诺夫斯基沃尔夫冈·库尔特·赫尔曼·帕诺夫斯基(德语:Wolfgang Kurt Hermann Panofsky,1919年4月24日-2007年9月24日),德国-美国物理学家。
  • 欧文加利福尼亚大学欧文分校(英语:University of California, Irvine;缩写:UCI 或 UC Irvine),简称加州大学欧文分校,是一所位于美国加利福尼亚州欧文的公立研究型大学,它是加利福尼亚
  • 假如没有遇见你彭豆豆、邵伟桐北京曼荼罗影视文化传媒有限公司灵河文化传媒(上海)有限公司《假如没有遇见你》(英语:Imagine Me Without You),2018年中国爱情公路剧。本剧取材真实故事,由彭豆豆、
  • 洛桑市洛桑(法语:Lausanne,国际音标:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Ge
  • 藩属仆从国(英语:Client state),是指一个国家在政治、经济、军事、外交等领域,依附在另一个更强大国家之下。在仆从国之下,又分为卫星国、联系邦、傀儡政权、新殖民地、保护国、附庸国
  • 锐角在几何学中,角(拼音:jiǎo,注音符号:ㄐㄧㄠˇ)是由两条有公共端点的射线组成的几何对象。这两条射线叫做角的边,它们的公共端点叫做角的顶点。一般的角会假设在欧几里得平面上,但在
  • 人在囧途《人在囧途》(英语:Lost On Journey)是2010年上映的一部中国公路喜剧电影,由叶伟民执导,文隽监制。春节将近,由于三聚氰胺事件,牛奶厂没钱支付工钱,为回家过年,个性憨厚的工人牛耿(王
  • 双子座5号双子座5号(Gemini V)是双子座计划中的第三次载人飞行任务,也是美国的第十一次太空任务(包括飞行高度超过100千米的X-15任务)。替补成员同样接受任务训练,在主力成员因各种原因无法
  • 省总理大臣在加拿大,省长又称省总理和地区长官(英语:Premier,与联邦总理有共用称呼法语:Premier ministre),是加拿大各个省和地区政府职位最高的官员。现在加拿大有10位省长和3位地区长官。省
  • 威廉·斯坦利·杰文斯威廉姆·斯坦利·杰文斯(William Stanley Jevons,1835年9月1日--1882年8月13日),生于利物浦,英国著名的经济学家和逻辑学家。他在著作《政治经济学理论》(1871年)中提出了价值的边