零和博弈

✍ dations ◷ 2025-10-22 04:01:00 #零和博弈

零和博弈,又称零和游戏或零和赛局,(英语:Zero-sum game)与非零和博弈相对,是博弈论的一个概念,属非合作博弈。零和博弈表示所有博弈方的利益之和为零或一个常数,即一方有收入,其他方必有所失。在零和博弈中,博弈各方是不合作的。非零和博弈表示在不同策略组合下各博弈方的得益之和是不确定的变量,故又称之为变和博弈。如果某些战略的选取可以使各方利益之和变大,同时又能使各方的利益得到增加,那么,就可能出现参加方相互合作的局面。因此,非零和博弈中,博弈各方存在合作的可能性。国际经济中许多问题都属于非零和博弈问题,即国际经济中各方的利益并不是必然相互冲突的。零和博弈的例子有赌博、期货和选举等。

在零和属性(如果我方得益,敌方必然蒙受损失)下,是指结果是零和的情况下会出现帕累托最优的现象。反过来说,全体参加者可得益或受损的情况被称为非零和博弈。如果一个国家利用其过剩的香蕉与另一国家剩余的苹果进行贸易,因为两方都从交易中受惠,这是一个非零和的例子。

这个概念最早是在博弈论(game theory)上发展,因此零和情况通常被称为零和游戏(zero-sum game)。

在一个有限零和游戏之中,不同的博弈理论如纳什均衡和最小化极大算法都给予同样的解决办法。玩家需使用一个混合策略。

正则形式的博弈是解释零和博弈的其中一个方式。右方是一个两人零和游戏例子。

游戏流程如下:第一个玩家(红方)选择动作1或动作2,第二个玩家(蓝方),在不知道第一个玩家的选择状况下,选择动作A、动作B或动作C其中的一个。然后,玩家的选择被显示和每个玩家的分数受根据这些选择的结果而上升或下降。

例如:红方选择行动2,而蓝方选择行动B。结果,红方获得20分和蓝方失去20分。

现在在这个例子中,两位玩家都试图提高他们的分数。

红方的可能举动如下:“选择行动2的话,我最多失去20分,却只能赢得20分。若选择行动1的话,我只会输最多10分,但有机会赢得30分,所以行动1看上去比较有利。”蓝方使用类似的推理,他会选择行动C。如果这两名玩家采取同一策略,红方将赢得20分。但是,如果蓝方预计到红方选择行动1的策略,而选择行动B,以赢得10分。又或者,如果红方又预计到此技俩和选择行动2,以获得20分。到底结果会是怎样?

数学家约翰·冯·诺伊曼认为概率可以解决这一困境。这两名玩家应对其可选的行动计算其胜出概率,然后根据这些概率,使用一个随机逻辑元件,选择他们的行动。每个玩家计算概率。这最小化极大算法可以计算所有二人零和游戏的最佳战略。

对应上面的例子,红方选择动作1的概率为4/7和行动2的概率为3/7,而蓝方选择动作的概率为0、4/7和3/7,对应A、B和C三个行动。及后红方平均每场比赛将会赢得20/7分。

举个更经典的例子:杨丞琳与林依晨各持有两张扑克牌,杨丞琳的牌是黑桃A和红心10,林依晨的牌是方块A和梅花10,两人各出一张牌:

(1)如果规则为:若同色则杨丞琳胜,否则林依晨胜,胜者可赢对方1元,则她俩的收益矩阵为:

此时,只有混合策略纳什均衡,而没有纯策略纳什均衡。

(2)如果规则为:林依晨要付给杨丞琳钱,而此钱数为两人所出牌的点数总和,则她俩的收益矩阵为:

显然,杨丞琳希望她可以得到多一点的钱,因此她会出10点,而林依晨则希望她付出的钱能够少一点,故她会出A,从而,左下角的方格为纳什均衡点,此时,就有纯策略纳什均衡了。

(3)如果规则为:若同色则杨丞琳胜,否则林依晨胜,胜者依她自己所出的点数赢对方若干元,则她俩的收益矩阵为:

对杨丞琳来说,只有出红心10才有机会赢得最大值(10元),但显然这样做对她而言是比较冒险的,因为,虽然不管杨丞琳出什么牌,她的期望值都是0元,但对林依晨来说却不是如此,若林依晨出方块A,期望值是-4.5元,出梅花10,期望值则是+4.5元,因此,林依晨“应该”会出梅花10,杨丞琳想到了这一点,就不会出红心10,而会出风险相对较小的黑桃A与之对抗,但林依晨又会想到这一点。不过,对林依晨来说,若杨丞琳出黑桃A,林依晨出两张牌所赢得的钱仅相差2元而已!远小于杨丞琳出红心10时的20元。所以,出方块A是比较冒险的,林依晨无论如何都会出梅花10。杨丞琳若出红心10,很可能会落到最坏的结果--她输了10元,所以,杨丞琳的最后作法是,出黑桃A。最后,杨丞琳就赢了1元。在此种情况下,有纯策略纳什均衡,也有混合策略纳什均衡。纯策略纳什均衡是:杨丞琳只出黑桃A、林依晨只出梅花10;混合策略纳什均衡是:杨丞琳应以1/11的比例出红心10、以10/11的比例出黑桃A,林依晨应以1/2的比例出梅花10、以1/2的比例出方块A,这样可以让对访无论出什么牌,其期望值都是0元,也就能使自己的收益最大化。

许多经济形势并不是零和博弈,由于有价值的商品和服务可以创建、销毁或分配,以上任何一种状况将创造一个净损失或得益。假设对手的行为是合理的,任何商业交易都是非零和博弈,因为每一方必须考虑它接受的货物是比它交付的商品更有价值。经济交流必须对交易双方有利,而且不能是零和博弈,这样每一方都可以克服各自的交易成本。

最常见的例子就是社会心理学中的社会陷阱,在某些情况下,我们可以追求个人的利益,从而加强我们的集体幸福。

在幽默的范畴里,零和博弈被引申为“快乐守恒定律”(Conservation of Happiness),意思是“有人快乐,就必定有人失落”,也就是“快乐必须要建筑于别人的痛苦身上”。

相关

  • 支序分类学支序分类学(英语:Cladistics)又称亲缘分支分类学,是一种生物分类的哲学,其指只依据演化树分支的顺序,而不参考形态上的相似性来排列物种。此一学派的主要贡献者一般认为是德国昆虫
  • 法医毒理学法医毒理学(Forensic toxicology)是一门主要应用毒理学及有关学科的理论和技术,研究与法律有关的自杀、他杀和意外或灾害事故引起中毒的学科。药物滥用、环境污染、医源性药物
  • 轨道离心率在天文动力学,架构在标准假说下的任何轨道都必须是圆锥切面的形状。圆锥切面的离心率,轨道离心率是定义轨道形状的重要参数,而且定义了绝对的形状。离心率可以解释为形状从圆形
  • 裸花碱蓬裸花碱蓬(学名:),又称裸花卤兼蓬,为藜科碱蓬属下的一个种。多生长在盐碱滩上。
  • 科特迪瓦国徽科特迪瓦国徽中心图案为一面绘有非洲象头的盾徽(其长牙即国名的来源),上方有升起的太阳。左右有油棕各一株,是当地的主要农作物。饰带上以法语书有国名。
  • 动画新闻网动画新闻网(英语:Anime News Network,缩写ANN)是报导动漫资讯、J-pop、其他北美和日本御宅族文化动态的美国新闻网站。有时它也会报导世界其他地方的类似新闻动态。它提供评论和
  • 裴士锋裴士锋(英语:Stephen R. Platt),研究中国近代史的美国汉学家、历史学家、作家,马萨诸塞大学阿默斯特分校教授,专长为十九世纪中国史、中国对外关系。裴士锋本科时的专业为英语,毕业
  • 李士达李士达(1550年-1620年),字通甫,号仰槐,直隶吴县(今苏州市)人。明朝书画家。陕西乡试第六十一名。万历二年(1574年)甲戌科进士。工人物、山水画。传世作品有《三驼图》、《浔阳琵琶图》
  • 瓦卢瓦的玛德琳瓦卢瓦的玛德琳(法语:Madeleine de Valois,1520年8月10日-1537年7月7日),苏格兰王后(英语:List of Scottish consorts),法国国王法兰索瓦一世的女儿。1537年,玛德琳与苏格兰国王詹姆斯
  • 增岛六一郎增岛六一郎(ますじま ろくいちろう,1857年8月6日(安政4年6月17日)-1948年(昭和23年)11月13日),是现今日本滋贺県彦根市出生的律师。由于是其父亲六十一岁时诞生的孩子,所以被取名为六