策略 (博弈论)

✍ dations ◷ 2025-12-02 20:27:02 #策略 (博弈论)

在博弈论里，玩家在博弈中的策略是指在所有可能发生情况下的一套完整行动计划；这完全决定了玩家的行为。玩家的策略会决定玩家在博弈的任一阶段所采取的行动，不论这一阶段之前是如何演变而来的。

策略组合是每个玩家都完全选定他们在博弈中所有行动的一套策略。一个策略组合对每个玩家都必须包括一个且只能一个的策略。

策略有时会和移动搞混。移动是指玩家在博弈中某一点所采取的行动；策略则是完整的算法，告诉玩家在博弈中的每一个可能情况下要如何动作。

策略集合是个由玩家所能采取的策略所组成的集合。

若玩家有有限个具体的策略可供选择，则称其有个有限策略集合。例如，在单一次剪刀、石头、布里，每一个玩家都有一个有限策略集合 {剪刀, 石头, 布} 。若有无限个具体的策略可供选择，则称其有个无限策略集合。例如，有规范出价增额的拍卖会有个无限策略集合 {$10, $20, $30, ...} 。另外，在分蛋糕问题里则有个连续的策略集合 {在蛋糕的百分之零至百分之百间的任一处切分} 。

在动态博弈里，策略集合是由玩家能够给定机器人如何进行博弈的规则所组成的。例如，在最后通牒博弈里，第二位玩家的策略集合应该是由要接受及要拒绝的各种规则所组成的。

在贝叶斯博弈里，其策略集合和动态博弈的相似，由任何私有情报所会采取的行动规则所组成。

在应用博弈论里，策略集合的定义是使博弈能同时可解及有意义的重要一部分；利用对整个问题的了解来限制策略空间，以简化问题。

例如，严格来说，在最后通牒博弈里，玩家可以有策略如下：“拒绝 ($1, $3, $5, ..., $19)，而接受 ($0, $2, $4, ...,$20) ”。包括所有的策略会使得策略空间变得很大，并且得到一个稍难的问题；但对这博弈的理解，相信是可以限制其策略集合为 {拒绝所有不大于的钱，而接受所有大于的钱；这里的等于 ($0, $1, $2, ..., $20) 的其中一个} 。

策略集合是由玩家能够施行的纯策略所组成的集合。例如“剪刀、石头、布”中，玩家只有剪刀、石头和布这三个策略。纯策略就是只使用策略集合中其中一条策略。

混合策略是对每个纯策略分配一个几率而形容的策略。混合策略允许玩家随机选择一个纯策略。因为几率是连续的，所以即使策略集合是有限的，也会有无限多个混合策略。

当然，严格来说，每个纯策略都是一个“退化”的混合策略，某一特定纯策略的几率为，其他的则为。

完全混合策略是个混合策略，其对每个纯策略都分配了一个不为零的几率。（完全混合策略对如颤手完全均衡之类的均衡精细很重要。）

假设一收益矩阵表示如右（为一协调博弈）。这里，一个玩家选择行(Row)，另一个玩家选择列(Column)。行玩家得到第一个收益，列玩家则得到第二个。若行玩家偏向百分之百选择，则称他在玩纯策略。若列玩家偏向以掷硬币来决定，若头朝上则选择，若字朝上则选择，则称他在玩混合策略，而非纯策略。

在约翰·福布斯·纳什的一篇著名的论文里，他证明出对每个有限博弈，都存在一个均衡。纳什均衡可以分成两类：“纯策略纳什均衡”，之中的所有玩家都玩纯策略；和“混合策略纳什均衡”，之中至少有一位玩家玩混合策略。并不是每个博弈都会有纯策略纳什均衡，例如赌便士就只有混合策略纳什均衡，而没有纯策略纳什均衡。不过，还是有许多博弈有纯策略纳什均衡（如协调博弈、囚徒困境和猎鹿博弈）。甚至，有些博弈能同时有纯策略和混合策略均衡。

在1980年代时，混合策略的概念曾遭受很严重的攻击，被认为是“直觉地有问题”。混合策略的核心－随机缺乏行为的支持，人们很少会凭运气做决定。此一行为问题在认知的难题上显得更加严重，因为没有人能够在没有随机数发生器的帮助之下做出随机的决定来。

在阿里尔·鲁宾斯坦的一篇论文中，他描述了另一个了解此一概念的方法。首先，基于纯化理论，并假设混合策略的解释只是反应了对玩家信息和决策过程认识的缺乏。明显地，随机决定被认为是不明确、利益无关的外部因素的结果。然而，一个由不明确的因素决定的结果很难令人感到满意。

第二个解释是，想像有许多组玩家在进行博弈，每组玩家都选择一个纯策略，且利益是依赖玩家们选择策略的百分比来决定的。因此，混合策略便表示是每一组玩家所选择的纯策略的分布。然而，这对玩家都是单独的一组时，提不出什么合理的解释。

之后，奥曼和布兰登柏格)重新将纳什均衡解释成是一种“信念”的均衡，而不是行动的。例如，在剪刀、石头、布里，信念的均衡即每个玩家都“相信”对方会平均地施行每一个策略。然而，此一解释弱化了纳什均衡的预测能力，因为在此均衡里，“确实”地施行石头的纯策略也是可能的。

直至今日，学者们对混合策略的结果依然是很矛盾的。混合策略依然广泛地被应用不存在纯策略均衡的博弈中，以提供其一个纳什均衡，但这些模型都无法说清楚为何且如何玩家能够随机化他们的决定。

相关

延胡索酸延胡索酸(Fumaric Acid)，又名富马酸、紫堇酸或地衣酸，即反丁烯二酸（IUPAC名为(E)-丁烯二酸），是一种无色、易燃的晶体，由丁烯衍生出的羧酸。它的化学式是C4H4O4。燃烧延胡索酸会释
猎鹰1号猎鹰1号运载火箭（Falcon 1）为可部分重复使用的发射系统，SpaceX设计制造此火箭供发射商业太空任务，此两节式火箭使用液态氧/煤油作为燃料。第一节使用一颗Merlin；第二节使用一颗Ke
.gp.gp为法国海外属地瓜德罗普国家及地区顶级域（ccTLD）的域名。A .ac .ad .ae .af .ag .ai .al .am .ao .aq .ar .as .at .au .aw .ax .az B .ba .bb .bd .be .bf .bg .bh
纯水纯净水，简称净水或纯水，文义上是纯洁、干净，不含有杂质或细菌的水，是以符合生活饮用水卫生标准的水为原水，通过电渗析器法、离子交换器法、反渗透法、蒸馏法及其他适当的加工方法
NISO美国国家信息标准组织（National Information Standards Organization，简称NISO）是美国的非营利标准制定组织，发展、维持并出版有关于出版业、书目与图书馆应用学的相关技术标准
CGI GroupCGI集团（CGI Group Inc.）是一家总部位于加拿大蒙特利尔的跨国公司，业务涉及IT咨询和外包服务及其相关产业。2012年以27亿加元的价格收购英国IT服务公司Logica，因此成为世界第五
半兽人半兽人（英语：Orc、Ork），或译作兽人，或直译为奥克、欧克，是奇幻文学作品当中的一个虚构生物或种族。关于Orc一词的来源，有说法是Orc/Ork（半兽人）由拉丁文Orcus——一位神祇的称号“阴
中央大学中央大学，可以指：
京阪神京阪神（日语：京阪神／けいはんしん Kei han shin */?）是对日本的京都市、大阪市、神户市之合称，同时也指以这3座都市为中心的大都会区，为近畿地方的发展核心，也是日本第二大都会区
2010年尤里卡地震2010年尤里卡地震是一次发生在2010年1月9日下午4时27分38秒的地震，地震发生于美国加利福尼亚州洪堡县附近，测定地震强度为里氏6.5级。震中位于加州北部小城芬代尔以西大约22英