频率分析

✍ dations ◷ 2025-06-07 13:01:32 #频率分析
频率分析在数学、物理学和信号处理中是一种分解函数、波形、或者信号的频率组成,以获取频谱的方法。在密码学中,频率分析是指研究字母或者字母组合在文本中出现的频率。应用频率分析可以破解古典密码。频率分析基于如下原理:在任何一种书面语言中,不同的字母或字母组合出现的频率各不相同。而且,对于以这种语言书写的任意一段文本,都具有大致相同的特征字母分布。比如,在英语中,字母E出现的频率很高,而X则出现得较少。类似地,ST、NG、TH,以及QU等双字母组合出现的频率非常高,NZ、QJ组合则极少。英语中出现频率最高的12个字母可以简记为“ETAOIN SHRDLU”。在一个简单的替换密码中,明文中的每一个字母都被另一个字母替换,而且明文中相同的字母在转换为密文时总是被同一个字母所替换。比如,所有的e都会被替换成 X.一个含有大量X的密文消息会向密码破译者暗示X替换e.现假设爱丽丝与鲍伯中的伊夫截获了一段密码(列于下方),它使用了一个简单替换密码进行加密:在这个例子中,大写字母表示密文,小写字母则表示明文(或猜测在这样),而X~t用来代表一个关于:密文X 代表明文t的猜测。伊夫可以使用频率分析,以下面的消息来帮助解决密文大意:单字母中I最为常见;XL是最为常见的双字母组;而XLI则为最为常见的三字母组,且密文中找不到D。根据英文的字母分布,e是最常见的单字母,th是最为常见的双字母组,而the则为最为常见的三字母组。因些她猜测X~t、L~h及I~e。第二个密文中最常见的字母是E;t是英文中第二常见的字母,因此应该是E~t,但由于已假设X~t,所以伊夫暂且假设E~a。姑且让这些假设进行解码,获得以下的(部分)已解密消息。使用这些初始的猜测,伊夫发现了某些规律,来让她可以确认其猜测,例如"that"。此外,其他规律则建议了进一步的猜测:"Rtate"可能是"state",即R~s。同样,"atthattMZe"可以是"atthattime",写出M~i及Z~m。而且,"heVe"可能是"here",给出V~r。再填入本来的密文,获得:反过来,这些猜测还建议一些例子(例如"remarA"可能是"remark",即A~k)。接着,相对简单地就可推断出其余字母,最终产生明文:到了此时,伊夫便可以加上空格及标点符号:其实这个例子是来自金甲虫,正好伊夫的猜测全部正确。这并非总是如此,个别明文中的统计资料变化可能意味着最初的猜测并不正确。这样可能就要做回溯法来更正错误或进一步推测。明文中没有表现出预期的字母频率分布也有可能。越短的消息越会表现出其更多的变化。明文本来就是经过人为扭曲的文本,例如整篇明文没有了一些字母,通常会是最常见的“e”,这样就称为漏字文。第一个已知频率分析(事实上,是任何一种密码分析)的解释是在9世纪时,阿拉伯博学家-肯迪所著的《手稿上破译加密消息》之上。 它对于古兰经的文本研究发现阿拉伯文有一个特别的字母频率。其使用快速蔓延,类似的系统在文艺复兴时期的欧洲国家十分流行。1474年,Cicco Simonetta 写了一本手册,上有关于破译已加密的拉丁语和意大利语文本。密码学家为加强简单替换加密,使用了数项措施,包括:所有这些抵御频率分析攻击的尝试都有一个缺点:它增加了加密和解密的难度,可能导致使用失误。而最著名的的事件如下:最初英国外交部拒绝使用波雷费密码,认为它太复杂。当惠斯登证明邻近学校的四个男孩中,有三个可以在15分钟内学会这种方法,外交部副秘书长的回应是:“这是有可能的,可惜你不能教晓那些高层人员。”20世纪首50年,旋转盘的使用兴起(例如,恩尼格玛密码机),其基本上不会受到直接频率分析攻击。然而,其他种类的分析成功解译了其中一些信息(其中最著名为Ultra计划)。频率分析只需基本了解明文字母的统计,以及一些解决问题的能力,而且此方法可用人手解译。在第二次世界大战期间,英国与美国同时使用各大报纸上字谜和密码比赛来招募解码专家。轴心国中使用了某些很容易遭频率分析破解的密码(例如日本第二次世界大战时的领事密码)。机械替换加密或解密亦于第二次世界大战之时开始使用。现时,频率分析基本上全由电脑来完成,因此,现时替换式密码很容易就被破解。柯南‧道尔所写的侦探小说《福尔摩斯‧归来记》中《跳舞的人》篇中,福尔摩斯就在墙上看到五个跳舞人的画,他从英语用语对答的常用性与英语使用频率最高的字母E猜出了其中一次跳舞人画所代表的字为Never,从而破解了字谜。爱伦坡的《金甲虫》亦是一小说有密文的例子。

相关

  • 血吸虫病血吸虫病(英语:schistosomiasis、bilharzia、snail fever、Katayama fever)又称裂体虫病、曼森氏病,是一个由血吸虫类的寄生虫所导致之疾病,属于WHO所宣布的六大热带医学疾病之一
  • 美秀县美秀县(越南语:Huyện Mỹ Tú)是越南朔庄省下辖的一个县。美秀县下辖1市镇8社。
  • 常态化遗传漂变,或基因漂变(genetic drift),是指种群中基因库在代际发生随机改变的一种现象。由于任何一个个体的生存与繁殖都受到随机因素影响,繁殖过程可看做一种抽样,子代携带的等位
  • 刺猬刺猬信号通路(英语:Hedgehog signaling pathway)是重要的信号传导通路。刺猬信号通路是动物发育的关键调控之一,在所有的两侧对称动物中都有表达。刺猬信号通路得名于在其多肽配
  • 前裸子植物门前裸子植物纲(学名:Progymnospermophyta)是一种已灭绝的维管植物,含有木质部分,但亦有孢子。前裸子植物门与蕨类植物门(Pteridophyta)关系密切,被认为是从三向蕨纲(英语:Trimerophytop
  • 白川英树白川英树(日语:白川 英樹/しらかわ ひでき Shirakawa Hideki ?,1936年8月20日-),日本化学家,筑波大学名誉教授。日本学士院会员。文化勋章表彰。文化功劳者。白川教授因有关导电聚
  • UCLA粉蓝色和金色加利福尼亚大学洛杉矶分校(英语:University of California, Los Angeles),简称加州大学洛杉矶分校(UCLA),是一所位于美国加利福尼亚州洛杉矶的公立研究型大学,创办于191
  • 汗疱疹汗疱疹(英语:Dyshidrosis)是一种湿疹类的皮肤病,症状为患者手或脚上长出小水泡。它是急性、难以根治的皮肤病,且容易反复发作。汗疱疹好发于手指、手掌和脚底,忽然发病之时常伴随
  • 穴位腧穴又称穴位,是中国传统医学在人体分布体表的脏腑经络循环路线中,对气血汇聚、转输与出入之所的特定处所给定的名称,既是疾病的反应点,又是针灸推拿等医学临床的刺激点。腧穴在
  • 落叶松落叶松属(学名:Larix)是松科下的一个属,主要分布在北半球。落叶松属约有10-14种。