拜占庭将军问题

✍ dations ◷ 2025-08-13 06:20:20 #分布式计算,计算机科学,理论计算机科学,计算理论,容错

拜占庭将军问题(Byzantine Generals Problem),是由莱斯利·兰波特在其同名论文中提出的分布式对等网络通信容错问题。

在分布式计算中,不同的计算机通过通讯交换信息达成共识而按照同一套协作策略行动。但有时候,系统中的成员计算机可能出错而发送错误的信息,用于传递信息的通讯网络也可能导致信息损坏,使得网络中不同的成员关于全体协作的策略得出不同结论,从而破坏系统一致性。拜占庭将军问题被认为是容错性问题中最难的问题类型之一。

莱斯利·兰波特在其论文中描述了如下问题:

一组拜占庭将军分别各率领一支军队共同围困一座城市。为了简化问题,将各支军队的行动策略限定为进攻或撤离两种。因为部分军队进攻部分军队撤离可能会造成灾难性后果,因此各位将军必须通过投票来达成一致策略,即所有军队一起进攻或所有军队一起撤离。因为各位将军分处城市不同方向,他们只能通过信使互相联系。在投票过程中每位将军都将自己投票给进攻还是撤退的信息通过信使分别通知其他所有将军,这样一来每位将军根据自己的投票和其他所有将军送来的信息就可以知道共同的投票结果而决定行动策略。

系统的问题在于,将军中可能出现叛徒,他们不仅可能向较为糟糕的策略投票,还可能选择性地发送投票信息。假设有9位将军投票,其中1名叛徒。8名忠诚的将军中出现了4人投进攻,4人投撤离的情况。这时候叛徒可能故意给4名投进攻的将领送信表示投票进攻,而给4名投撤离的将领送信表示投撤离。这样一来在4名投进攻的将领看来,投票结果是5人投进攻,从而发起进攻;而在4名投撤离的将军看来则是5人投撤离。这样各支军队的一致协同就遭到了破坏。

由于将军之间需要通过信使通讯,叛变将军可能通过伪造信件来以其他将军的身份发送假投票。而即使在保证所有将军忠诚的情况下,也不能排除信使被敌人截杀,甚至被敌人间谍替换等情况。因此很难通过保证人员可靠性及通讯可靠性来解决问题。

假使那些忠诚(或是没有出错)的将军仍然能通过多数决定来决定他们的战略,便称达到了拜占庭容错。在此,票都会有一个默认值,若消息(票)没有被收到,则使用此默认值来投票。

上述的故事映射到计算机系统里,将军便成了计算机,而信差就是通信系统。虽然上述的问题涉及了电子化的决策支持与信息安全,却没办法单纯的用密码学与数字签名来解决。因为电路错误仍可能影响整个加密过程,这不是密码学与数字签名算法在解决的问题。因此计算机就有可能将错误的结果提交去,亦可能导致错误的决策。

在1982年的论文中提过几个解决方案。方案中把问题往下拆解,认为在“拜占庭将军”的问题可以在“军官与士官的问题”里解决,以降低将军问题的发生。而所谓的“军官与士官的问题”,就是探讨军官与他的士官是否能忠实实行命令。

此外,1980年代还有其他用来达到拜占庭容错的架构被提出,如:FTMP、MMFCS与 SIFT。

1999年,卡斯托(Miguel Castro)与李斯克夫(Barbara Liskov)提出了实用拜占庭容错(PBFT)算法。该算法能提供高性能的运算,使得系统可以每秒处理成千的请求,比起旧式系统快了一些。

而在PBFT之后,许多用于拜占庭容错(BFT)的通信协议也被提出来改善其通信的强健性与效率。比如Q/U、HQ、Zyzzyva与ABsTRACTs...,用来提升效率。而Aardvark与RBFT是用来加强强健性。另外,Adapt则使用原有的BFT协议做调适,以强化其效率与强健性。BFT协议更可以借由加入可任务的单元,以减少发出副本的次数。比如:A2M-PBFT-EA与MinBFT。

在分布式对等网络中需要按照共同一致策略协作的成员计算机即为问题中的将军,而各成员计算机赖以进行通讯的网络链路即为信使。拜占庭将军问题描述的就是某些成员计算机或网络链路出现错误、甚至被蓄意破坏者控制的情况。

在点对点式数字货币系统比特币里,比特币网络的运作是平行的(parallel)。各节点与终端都运算著区块链来达成工作量证明(PoW)。工作量证明的链接是解决比特币系统中拜占庭问题的关键,避免有问题的节点(即前文提到的“反叛的将军”)破坏数字货币系统里交易帐的正确性,是对整个系统的运行状态有着重要的意义。

在一些飞行器(如波音777)的系统中也有使用拜占庭容错。而且由于是即时系统,容错的功能也要能尽快回复,比如即使系统中有错误发生,容错系统也只能做出一微秒以内的延迟。

一些航天飞机的飞行系统甚至将容错功能放到整个系统的设计之中。

拜占庭容错机制是将收到的消息(或是收到的消息的签名)转交到其他的接收者。这类机制都假设它们转交的消息都可能念有拜占庭问题。在高度安全要求的系统中,这些假设甚至要求证明错误能在一个合理的等级下被排除。当然,要证明这点,首先遇到的问题就是如何有效的找出所有可能的、应能被容错的错误。这时候会试着在系统中加入错误插入器。

相关

  • 芝麻芝麻(学名:Sesamum indicum),别名胡麻、脂麻、油麻,是胡麻科胡麻属植物。虽然它的近亲在非洲出现,但品种的自然起源仍然未知。它遍布世界上的热带地区。在温带地区也有种植,比如中
  • 张海超张海超开胸验肺事件,是指2009年河南省新密市农民工张海超为了证明自己得的是职业病尘肺病,却多方求助无门的情况下,而自己要求开胸验肺的一个惊人之举。暴露出现在中国职业病维
  • 虫部,為漢字索引中的部首之一,康熙字典214個部首中的第一百四十二個(六劃的則為第二十五個)。就繁體和簡體中文中,虫部歸於六劃部首。虫部通常以左、右、下方為部字。且無其他部
  • 劳工节美国的劳动节(英语:Labor Day)规定在每年九月的第一个星期一,是联邦的法定节假日,用以庆祝工人对经济和社会的贡献。对许多美国人来说劳动节的到来也意味着夏季的结束,同时也是举
  • 代位父母代位父母(拉丁语:in loco parentis),指某人或某组织在法律上承担父母职能与责任的情况。该术语起源于英国的英美法系,当中将组织与个人的代位父母情况做区隔。首先,代位父母允许大
  • 返祖返祖现象(atavism)是指个别生物体出现了其祖先所具有的性状的现象。返祖现象在很多物种中都有发生,如双翅目昆虫的后翅已经退化为平衡槌,但偶尔会出现有两对翅膀的个体;家养的鸡
  • 多伦多证券交易所多伦多证券交易所(Toronto Stock Exchange,缩写:TSX)是加拿大最大、北美洲第三大、世界第七大的证券交易所,由多伦多证券交易所集团(TSX Group,TSX: X)拥有及管理。在该交易所上市的
  • 水平日晷日.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-setting
  • 第十一第十一航空队(英语:Eleventh Air Force)是美国太平洋空军下属的一个编号航空队,指挥部位于阿拉斯加州的埃尔门多夫空军基地(英语:Joint Base Elmendorf–Richardson)。
  • 萨马拉州萨马拉州(俄语:Самарская область,罗马化:Samarskaya oblast)是俄罗斯联邦主体之一,属伏尔加联邦管区。位于东欧平原东南部,伏尔加河在西部流过。面积53,600平方公