正则形式的博弈

✍ dations ◷ 2025-06-07 05:44:06 #正则形式的博弈

在博弈论中,正则形式(Normal-form game)是描述博弈的一种方式。与延展形式不同,正则形式不用图形来描述博弈,而是用矩阵来陈述博弈。与延展形式的表述方式相比,这种方式在识别出严格优势策略和纳什均衡上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的策略,以及和与其相对应的收益。

在非完美信息的完全静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。

有种博弈是参与者同时(或至少在做出行动前不观察其他参与者的动作)做出行动,并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如,如果甲做出行动“顶”,而乙做出行动“左”,则甲得到收收益4,乙得到收益3。在每个回合,第一个数字代表排参与者(此处为甲)的收益,第二个数字代表列参与者(此处为乙)的收益。

对称博弈(其收益不是依赖于参与者选择的动作)常常被表述为只有一种收益,即竖排参与者的收益。例如,左右两边的收益矩阵表述的是同一个博弈。

收益矩阵有助于剔除劣势策略,而且经常被用于说明这个概念。例如,在囚徒困境中(右图),参与者会发现因为其他人的,成了严格劣势策略。参与者会比较每列的第一个数字,在这个例子中,3>2且1>0。这表明无论横排参与者怎样选择,竖排参与者选择都比较好些。类似地,参与者会比较每列的第二个数字,同样也是3>2且1>0。这说明无论竖排参与者怎么做,横排参与者选择都比较好些。这就证明了此博弈唯一的纳什均衡是(,)。

这些矩阵只表述同时(或者更一般地,信息是不完美的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,和。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是:

右图是这个博弈的正则形式的表述方式。

为了用把博弈表述成正则形式,需要提供下列数据:

S k = { 1 , 2 , , n k } . {\displaystyle S_{k}=\{1,2,\ldots ,n_{k}\}.} 元组

σ = ( σ 1 , σ 2 , , σ m ) {\displaystyle {\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})} = {1, 2, ..., }中对每个参与者详细说明。

定义:一个正则形式的博弈的结构形如

( P , S , F ) {\displaystyle (P,\mathbf {S} ,\mathbf {F} )} = {1,2, ...,}是参与者集合,

S = ( S 1 , S 2 , , S m ) {\displaystyle \mathbf {S} =(S_{1},S_{2},\ldots ,S_{m})} 元组。

没有理由在前面的讨论中,把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧,关于有限博弈的研究非常艰深。

相关

  • 倭黑猩猩倭黑猩猩(学名:Pan paniscus),又名倭猩猩、僰猿、矮黑猩猩或巴诺布猿,是黑猩猩属下的两种动物之一,起先倭黑猩猩被认为和黑猩猩是同种生物,直到1920年代,才有人察觉两者的不同,而将之
  • CD43n/an/an/an/an/an/an/an/an/an/aCD43(白细胞分化抗原43)又名白细胞唾液酸糖蛋白(Leukosialin)或唾液酸蛋白(sialophorin),是一种跨膜表面蛋白,在人体中由SPN(唾液蛋白)基因编码。唾液
  • 布城布城(/pʊtrɑːdʒɑːjə/,英语和马来语:Putrajaya,全称:“布城联邦直辖区”)原名“Prang Besar”,旧译“布特拉再也”和“太子城”,是政府建立的新市镇,也是马来西亚的行政首都,是
  • 约瑟夫森布赖恩·约瑟夫森(英语:Brian Josephson,1940年1月4日-),英国物理学家,犹太人,生于威尔士卡地夫。在22岁,尚是一个博士生时,他就提出约瑟夫森结这一概念,并凭此赢得1973年诺贝尔物理学
  • span class=nowrapTbPOsub4/sub/span磷酸铽是一种无机化合物,化学式为TbPO4,它可由磷酸钠和氯化铽在溶液中反应得到,沉淀出的二水合物在800°C灼烧,可以得到无水物。磷酸铽在3660 A的紫外光下可以发出橙黄色的荧光,
  • 近针蚁亚科近针蚁属(Paraponera)隶属于蚁科近针蚁亚科,为其下唯一的属,其下包含两个物种,现生物种 Paraponera clavata ,俗名子弹蚁,分布于新热带区;已灭绝物种,体型极小的 Paraponera dieteri(
  • 卓惠珠卓惠珠(1963年8月20日-),昵称花妈,为部落格“帮助高功能自闭与亚斯伯格症理解人际互动困难和情绪障碍”版主,以及脸书粉丝页“帮助高功能自闭与亚斯伯格症”管理人,台湾媒体称之为
  • 加拉信府加拉信府(泰语:จังหวัดกาฬสินธุ์,皇家转写:Changwat Kalasin,泰语发音:),一译胶拉信府,是泰国东北部依善地区的府份。邻近府(从北顺时针)依序为:沙功那空府、穆达汉府、
  • 叶炜叶炜(英语:Max Yeh, 1937年-)是一位美国文史学者、收藏家,叶公超独子。曾将叶家收藏捐赠美国博物馆。家族祖籍浙江余姚。1937年生于中国,有一姐叶彤,英文名:Tung Yeh。名字源自《
  • 乔治城镇乔治城 (英语:Georgetown)是华盛顿哥伦比亚特区的一个社区。该社区有一所自己的大学乔治城大学,包括超过100个餐馆酒吧,区中的M-大街是华盛顿最有名的大街之一。