正则形式的博弈

✍ dations ◷ 2025-05-17 11:22:09 #正则形式的博弈

在博弈论中,正则形式(Normal-form game)是描述博弈的一种方式。与延展形式不同,正则形式不用图形来描述博弈,而是用矩阵来陈述博弈。与延展形式的表述方式相比,这种方式在识别出严格优势策略和纳什均衡上更有用,但会丢失某些信息。博弈的正则形式的表述方式包括如下部分:每个参与者所有显然的和可能的策略,以及和与其相对应的收益。

在非完美信息的完全静态博弈中,正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数,是从参与者策略空间的向量积到该参与者收益集合(一般是实数集,数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用)的映射。也就是说,参与者的收益函数把策略组合(所有参与者策略的清单)作为它的输入量,然后输出参与者的收益。

有种博弈是参与者同时(或至少在做出行动前不观察其他参与者的动作)做出行动,并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如,如果甲做出行动“顶”,而乙做出行动“左”,则甲得到收收益4,乙得到收益3。在每个回合,第一个数字代表排参与者(此处为甲)的收益,第二个数字代表列参与者(此处为乙)的收益。

对称博弈(其收益不是依赖于参与者选择的动作)常常被表述为只有一种收益,即竖排参与者的收益。例如,左右两边的收益矩阵表述的是同一个博弈。

收益矩阵有助于剔除劣势策略,而且经常被用于说明这个概念。例如,在囚徒困境中(右图),参与者会发现因为其他人的,成了严格劣势策略。参与者会比较每列的第一个数字,在这个例子中,3>2且1>0。这表明无论横排参与者怎样选择,竖排参与者选择都比较好些。类似地,参与者会比较每列的第二个数字,同样也是3>2且1>0。这说明无论竖排参与者怎么做,横排参与者选择都比较好些。这就证明了此博弈唯一的纳什均衡是(,)。

这些矩阵只表述同时(或者更一般地,信息是不完美的)做出行动的博弈。上述矩阵不能表述甲先做出行动,被乙观察到,然后乙再做出行动的博弈。因为在这个例子中,无法确定乙每次的策略。为了表述这种连续博弈,我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况,某种行动决不会出现。和前面一样,在这个博弈中乙有两种选择,和。与前面不一样的是,视甲的行动不同而定,乙有四种策略。这些策略是:

右图是这个博弈的正则形式的表述方式。

为了用把博弈表述成正则形式,需要提供下列数据:

S k = { 1 , 2 , , n k } . {\displaystyle S_{k}=\{1,2,\ldots ,n_{k}\}.} 元组

σ = ( σ 1 , σ 2 , , σ m ) {\displaystyle {\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})} = {1, 2, ..., }中对每个参与者详细说明。

定义:一个正则形式的博弈的结构形如

( P , S , F ) {\displaystyle (P,\mathbf {S} ,\mathbf {F} )} = {1,2, ...,}是参与者集合,

S = ( S 1 , S 2 , , S m ) {\displaystyle \mathbf {S} =(S_{1},S_{2},\ldots ,S_{m})} 元组。

没有理由在前面的讨论中,把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧,关于有限博弈的研究非常艰深。

相关

  • 普罗泰戈拉普罗泰戈拉(希腊语:Πρωταγόρας,约前490年-前420年)是一个古希腊哲学家,被柏拉图认为是诡辩学派的一员。普罗泰戈拉出生在色雷斯的阿布德拉城。柏拉图的《普罗泰戈拉篇》
  • 四氯乙烷四氯乙烷可以指以下两种互为同分异构体的化合物:
  • 360110 数学 120 信息科学与系统科学 130 力学 140 物理学 150 化学 160 天文学 170 地球科学 180 生物学210 农学 220 林学 230 畜牧、兽医科学 240 水产学310 
  • 维塔利·拉扎列维奇·金兹堡维塔利·拉扎列维奇·金兹堡(俄语:Виталий Лазаревич Гинзбург,转写:Vitaly Lazarevich Ginzburg,1916年10月4日-2009年11月8日),苏联著名理论物理学家和天
  • 光学频谱光学频谱,简称光谱,是复色光通过色散系统(如光栅、棱镜)进行分光后,依照光的波长(或频率)的大小顺次排列形成的图案。光谱中的一部分可见光谱是电磁波谱中人眼可见的唯一部分,在这个
  • 查尔斯·克里奇菲尔德查尔斯·路易斯·克里奇菲尔德(英语:Charles Louis Critchfield,1910年6月7日-1994年2月12日)是美国数学物理学家,1939年从乔治·华盛顿大学取得博士学位,师从爱德华·泰勒。1943年
  • 守望先锋联赛overwatchleague.com(全球)overwatchleague.cn(中国大陆)守望先锋联赛(英语:Overwatch League)是暴雪娱乐为电子游戏《守望先锋》举办的职业联赛。2016年暴雪嘉年华期间,暴雪公布了
  • 鳕角鳕鱼角(英语:Cape Cod),是美国东北部马萨诸塞州伸入大西洋的一个半岛,面积1033平方公里。1914年,美国在该半岛与大陆连接处开掘鳕鱼角运河,使鳕鱼角实际上成为了一个岛屿。
  • 城阳区城阳区是中国山东省青岛市所辖的一个市辖区,1994年6月起属青岛市区级建置,位于青岛北部近郊,总面积为553平方千米,2010年人口为74万。城阳区辖8个街道:城阳街道、夏庄街道、流亭
  • 邓州邓州市古称“邓”或“穰”,是中国河南省南阳市代管的一个县级市,邓州在河南省是省直管县之一,总面积约2300平方公里,地处南阳盆地中南部,位于河南省西南部,河南省和湖北省交界部位