正则形式的博弈

✍ dations ◷ 2025-12-10 17:10:58 #正则形式的博弈

在博弈论中，正则形式（Normal-form game）是描述博弈的一种方式。与延展形式不同，正则形式不用图形来描述博弈，而是用矩阵来陈述博弈。与延展形式的表述方式相比，这种方式在识别出严格优势策略和纳什均衡上更有用，但会丢失某些信息。博弈的正则形式的表述方式包括如下部分：每个参与者所有显然的和可能的策略，以及和与其相对应的收益。

在非完美信息的完全静态博弈中，正则形式的表述方式详细地说明了参与者策略空间和收益函数。策略空间是某个参与者的所有可能策略的集合。策略是参与者在博弈的每个阶段——不管在博弈中这个阶段实际上是否会出现——将要采取的行动的完整计划。每个参与者的收益函数，是从参与者策略空间的向量积到该参与者收益集合（一般是实数集，数字表示基数效用或序数效用——在正则形式的表述方式中常常是基数效用）的映射。也就是说，参与者的收益函数把策略组合（所有参与者策略的清单）作为它的输入量，然后输出参与者的收益。

有种博弈是参与者同时（或至少在做出行动前不观察其他参与者的动作）做出行动，并按照上述已做出行动的组合获得收益。右边的矩阵是这种博弈得正则形式的表述方式。例如，如果甲做出行动“顶”，而乙做出行动“左”，则甲得到收收益4，乙得到收益3。在每个回合，第一个数字代表排参与者（此处为甲）的收益，第二个数字代表列参与者（此处为乙）的收益。

对称博弈（其收益不是依赖于参与者选择的动作）常常被表述为只有一种收益，即竖排参与者的收益。例如，左右两边的收益矩阵表述的是同一个博弈。

收益矩阵有助于剔除劣势策略，而且经常被用于说明这个概念。例如，在囚徒困境中（右图），参与者会发现因为其他人的，成了严格劣势策略。参与者会比较每列的第一个数字，在这个例子中，3>2且1>0。这表明无论横排参与者怎样选择，竖排参与者选择都比较好些。类似地，参与者会比较每列的第二个数字，同样也是3>2且1>0。这说明无论竖排参与者怎么做，横排参与者选择都比较好些。这就证明了此博弈唯一的纳什均衡是（，）。

这些矩阵只表述同时（或者更一般地，信息是不完美的）做出行动的博弈。上述矩阵不能表述甲先做出行动，被乙观察到，然后乙再做出行动的博弈。因为在这个例子中，无法确定乙每次的策略。为了表述这种连续博弈，我们要列出乙在博弈进行期间所有的行动——尽管根据实际情况，某种行动决不会出现。和前面一样，在这个博弈中乙有两种选择，和。与前面不一样的是，视甲的行动不同而定，乙有四种策略。这些策略是：

右图是这个博弈的正则形式的表述方式。

为了用把博弈表述成正则形式，需要提供下列数据：

$S_{k}=\{1,2,\ldots ,n_{k}\}.$ 元组

${\vec {\sigma }}=(\sigma _{1},\sigma _{2},\ldots ,\sigma _{m})$ = {1, 2, ..., }中对每个参与者详细说明。

定义：一个正则形式的博弈的结构形如

$(P,\mathbf {S} ,\mathbf {F} )$ = {1,2, ...,}是参与者集合，

$\mathbf {S} =(S_{1},S_{2},\ldots ,S_{m})$ 元组。

没有理由在前面的讨论中，把参与者数量有限或每个参与者的策略有限的博弈排除在外。因为要用到泛函分析的技巧，关于有限博弈的研究非常艰深。

相关

克隆失能株落失能（英语：Clonal anergy）是一个免疫学名词。描述的是周边淋巴球对于外来物质失去产生免疫反应的能力，而导致耐受性。失能的淋巴球株落将无法对于特定的抗原产生免疫反应，通
世界各大洲洲，或大洲，指地球上的大块陆地地区，人类将现今的地球分为亚洲（全称亚细亚洲）、欧洲（全称欧罗巴洲）、非洲（全称阿非利加洲）、大洋洲、北美洲（全称北亚美利加洲）、南美洲（全称南亚美利加
大祭司大祭司，或称为最高祭司（拉丁文Pontifex Maximus，字面意思是“最高的pontiff”）是古罗马Pontiff祭司团体（英文：College of Pontiffs）的最高阶祭司。这是古罗马宗教中最为重要的职位，
无尾目无尾目（学名：Anura）是两生纲的一个目，其下生物即蛙或蟾。该目的生物成体基本无尾，卵一般产于水中，孵化成蝌蚪，用鳃呼吸，经过变态，成体主要用肺呼吸，但多数皮肤也有部分呼吸功能。无尾
斯波尔丁县斯波尔丁县（Spalding County, Georgia）是美国乔治亚州西北部的一个县。面积517平方公里。根据美国2000年人口普查，共有人口58,417人，2005年增至61,289人。县治格里芬（Griffin）。成
抓氢键抓氢键（又称agostic键）是一种烷基、烯基、炔基或芳基中的氢与过渡金属间形成的3c2e键。
黄门黄门（梵语、巴利语 paṇḍaka；藏语 ma ning），音译半择迦、般吒、般荼迦、半择、半挓迦。意译为阉人、不男，即指男根损坏、无法作用之人，是佛教经典的名词，与古代印度阿育吠陀医学（如
粉碎粉碎是化工生产中一种单元操作，是一种纯机械过程的操作，对于体积过大不适宜使用的固体原料或不符合要求的半成品，要进行加工使其变小，这个过程就叫粉碎，粉碎主要有两种方式：
奥克斯纳德平原奥克斯纳德（Oxnard, California）是美国加利福尼亚州文图拉县最大的城市，临太平洋。面积94.8平方公里，2006年人口184,463人。1903年6月30日建市。‡该聚居地有部分隶属其他县份
赣州赣州市，简称虔，古称虔州、南康，通称赣南，是中华人民共和国江西省下辖的地级市，位于江西省南部。市境北连吉安市、抚州市，东接福建省三明市、龙岩市，南临广东省梅州市、河源市，西南达