频率分析

✍ dations ◷ 2025-11-30 20:21:30 #频率分析
频率分析在数学、物理学和信号处理中是一种分解函数、波形、或者信号的频率组成,以获取频谱的方法。在密码学中,频率分析是指研究字母或者字母组合在文本中出现的频率。应用频率分析可以破解古典密码。频率分析基于如下原理:在任何一种书面语言中,不同的字母或字母组合出现的频率各不相同。而且,对于以这种语言书写的任意一段文本,都具有大致相同的特征字母分布。比如,在英语中,字母E出现的频率很高,而X则出现得较少。类似地,ST、NG、TH,以及QU等双字母组合出现的频率非常高,NZ、QJ组合则极少。英语中出现频率最高的12个字母可以简记为“ETAOIN SHRDLU”。在一个简单的替换密码中,明文中的每一个字母都被另一个字母替换,而且明文中相同的字母在转换为密文时总是被同一个字母所替换。比如,所有的e都会被替换成 X.一个含有大量X的密文消息会向密码破译者暗示X替换e.现假设爱丽丝与鲍伯中的伊夫截获了一段密码(列于下方),它使用了一个简单替换密码进行加密:在这个例子中,大写字母表示密文,小写字母则表示明文(或猜测在这样),而X~t用来代表一个关于:密文X 代表明文t的猜测。伊夫可以使用频率分析,以下面的消息来帮助解决密文大意:单字母中I最为常见;XL是最为常见的双字母组;而XLI则为最为常见的三字母组,且密文中找不到D。根据英文的字母分布,e是最常见的单字母,th是最为常见的双字母组,而the则为最为常见的三字母组。因些她猜测X~t、L~h及I~e。第二个密文中最常见的字母是E;t是英文中第二常见的字母,因此应该是E~t,但由于已假设X~t,所以伊夫暂且假设E~a。姑且让这些假设进行解码,获得以下的(部分)已解密消息。使用这些初始的猜测,伊夫发现了某些规律,来让她可以确认其猜测,例如"that"。此外,其他规律则建议了进一步的猜测:"Rtate"可能是"state",即R~s。同样,"atthattMZe"可以是"atthattime",写出M~i及Z~m。而且,"heVe"可能是"here",给出V~r。再填入本来的密文,获得:反过来,这些猜测还建议一些例子(例如"remarA"可能是"remark",即A~k)。接着,相对简单地就可推断出其余字母,最终产生明文:到了此时,伊夫便可以加上空格及标点符号:其实这个例子是来自金甲虫,正好伊夫的猜测全部正确。这并非总是如此,个别明文中的统计资料变化可能意味着最初的猜测并不正确。这样可能就要做回溯法来更正错误或进一步推测。明文中没有表现出预期的字母频率分布也有可能。越短的消息越会表现出其更多的变化。明文本来就是经过人为扭曲的文本,例如整篇明文没有了一些字母,通常会是最常见的“e”,这样就称为漏字文。第一个已知频率分析(事实上,是任何一种密码分析)的解释是在9世纪时,阿拉伯博学家-肯迪所著的《手稿上破译加密消息》之上。 它对于古兰经的文本研究发现阿拉伯文有一个特别的字母频率。其使用快速蔓延,类似的系统在文艺复兴时期的欧洲国家十分流行。1474年,Cicco Simonetta 写了一本手册,上有关于破译已加密的拉丁语和意大利语文本。密码学家为加强简单替换加密,使用了数项措施,包括:所有这些抵御频率分析攻击的尝试都有一个缺点:它增加了加密和解密的难度,可能导致使用失误。而最著名的的事件如下:最初英国外交部拒绝使用波雷费密码,认为它太复杂。当惠斯登证明邻近学校的四个男孩中,有三个可以在15分钟内学会这种方法,外交部副秘书长的回应是:“这是有可能的,可惜你不能教晓那些高层人员。”20世纪首50年,旋转盘的使用兴起(例如,恩尼格玛密码机),其基本上不会受到直接频率分析攻击。然而,其他种类的分析成功解译了其中一些信息(其中最著名为Ultra计划)。频率分析只需基本了解明文字母的统计,以及一些解决问题的能力,而且此方法可用人手解译。在第二次世界大战期间,英国与美国同时使用各大报纸上字谜和密码比赛来招募解码专家。轴心国中使用了某些很容易遭频率分析破解的密码(例如日本第二次世界大战时的领事密码)。机械替换加密或解密亦于第二次世界大战之时开始使用。现时,频率分析基本上全由电脑来完成,因此,现时替换式密码很容易就被破解。柯南‧道尔所写的侦探小说《福尔摩斯‧归来记》中《跳舞的人》篇中,福尔摩斯就在墙上看到五个跳舞人的画,他从英语用语对答的常用性与英语使用频率最高的字母E猜出了其中一次跳舞人画所代表的字为Never,从而破解了字谜。爱伦坡的《金甲虫》亦是一小说有密文的例子。

相关

  • 澳门统计暨普查局统计暨普查局(简称:统计局,葡萄牙语:Direcção dos Serviços de Estatística e Censos,葡文缩写:DSEC)是指导、协调、综合、执行及监察澳门特别行政区统计活动之行政机关。前身
  • 肱骨肱骨(humerus)是肩到肘的长骨,是上臂的一部分。它将肩胛骨和前臂的桡骨和尺骨连接起来。肱骨由三部分组成。肱骨上端(英语:Upper extremity of humerus)包括一个球型部分、一个较
  • 低血钙低钙血症或低血钙症(Hypocalcaemia)系指血清中的钙离子浓度过低的状况,正常比例为 2.1 至 2.6 mmol/L(约为 8.8 到 10.7mg/dl,4.3 到 5.2 mEq/L),如果低于 2.1 mmol/L,就会认定为低
  • 耶鲁大学耶鲁大学(英语:Yale University)是一所坐落于美国康乃狄克州纽黑文市的私立研究型大学,是美洲大学协会的十四个创始校之一,及著名体育赛事联盟常春藤盟校的成员。学校最初于1701
  • 西北联邦管区西北部联邦管区(俄语:Северо-западный федеральный округ,罗马化:Severo-zapadny federalny okrug)位于俄罗斯西北部,是目前俄罗斯的联邦管区之一
  • 繁殖周期生物学上,生物生命周期指得是一个生物体在生命开始到结束周而复始所历经的一系列变化过程。“这个概念与生命史,发育生物学和个体发生学密切相关,但在强调再生方面有所差异。”
  • 视黄酸维A酸(Tretinoin、ATRA),又称全反式维甲酸及视黄酸,分子式:C20H28O2,分子量300.44,CAS号302-79-4,熔点180℃。医学导航: 皮肤附件解剖/生理/发育病理/先天/肿瘤, 症状/齐名手术,
  • 四大部洲四大部洲,又称四洲、四大洲、四天下,是佛教中认为的在须弥山周围咸海中的四大洲,分别为东胜神洲、西牛贺洲、南赡部洲和北俱卢洲,分别住着四大天王。另外还有八小部洲。《西游记
  • 胡吉伐二世哈巴(Khaba)是埃及古王国时期的一位法老,一般认为其统治期接近于埃及第三王朝末期。他被认为是塞汉赫特的王位继承者。其统治期为四年,大概位于公元前2643年至2637年之间。 由于
  • C++C++是一种被广泛使用的计算机程序设计语言。它是一种通用程序设计语言,支持多重编程模式,例如过程化程序设计、数据抽象、面向对象程序设计、泛型程序设计和设计模式等。比雅