香农-范诺编码

✍ dations ◷ 2025-11-20 05:36:33 #香农-范诺编码

在数据压缩的领域里,香农-范诺编码(英语:Shannon–Fano coding)是一种基于一组符号集及其出现的或然率(估量或测量所得)构建前缀码的技术。其名称来自于克劳德·香农和罗伯特·范诺。在编码效率上,它并不能与霍夫曼编码一样实现编码(code word)长度的最低期望;然而,与霍夫曼编码不同的是,它确保了所有的编码长度在一个理想的理论范围 log P ( x ) {displaystyle {-log }P(x)} 之内。这项技术是香农于1948年,在他介绍信息理论的文章“通信数学理论”中提出的。范诺则在不久以后独立地以技术报告形式将其发布。 香农-范诺编码不应该与香农编码混淆,后者的编码方法用于证明Shannon's noiseless coding theorem,或与Shannon–Fano–Elias coding(又被称作Elias coding)一起,被看做算术编码的先驱。

香农-范诺编码将符号从最大可能性到最少可能性排序,并将排列好的信源符号分为两大组,使两组的概率和接近,并各赋予一个二进制符号“0”和“1”。只要有符号剩余,就以同样的过程重复这些步骤以此确定这些代码的连续编码数字。依次下去,直至每一组的只剩下一个信源符号为止。当一组已经仅剩余一个符号,显然,这意味着这一符号的编码是完整的,也不会成为任何其他符号的代码前缀。

香农-范诺编码能够产生相对高效的可变长度编码;对于每一个比特位而言,当两个较小的集合具有恰好相等的概率时,这一方法就能最有效地利用这一位编码的信息。然而,香农-范诺并不总是产生最优的前缀码:例如对概率{0.35,0.17,0.17,0.16,0.15},香农-范诺算法就无法给出理想的编码。出于这个原因,香农-范诺编码几乎从不被使用。

Shannon-Fano编码树是基于一个符号和对应频率的列表建立的。实际的算法很简单:

这个例子展示了一组字母的香农编码结构(如图a所示)这五个可被编码的字母有如下出现次数:

从左到右,所有的符号以它们出现的次数划分。在字母B与C之间划定分割线,得到了左右两组,总次数分别为22、17,这样就把两组的差别降到最小。通过这样的分割,A与B同时拥有了一个以0为开头的编码,C、D、E的前缀则为1,如图b所示。随后,在树的左半边,于A、B间建立新的分割线,这样A就成为了编码为00的叶子节点,B的编码为01。经过四次分割,得到了一个树形编码。如下表所示,在最终得到的树中,拥有最大频率的符号被两位编码,其他两个频率较低的符号被三位编码。

根据A,B,C两位编码长度,D,E的三位编码长度,最终的平均码字长度是

香农-范诺编码算法并非总能得到最优编码。1952年, David A. Huffman提出了一个不同的算法,这个算法可以为任何的可能性提供出一个理想的树。香农-范诺编码是从树的根节点到叶子节点所进行的的编码,霍夫曼编码算法却是从相反的方向,暨从叶子节点到根节点的方向编码的。

用以上Shannon - Fano例子所使用的分析,即:

首先将D、E合并,它们频率和为11(图a至图b)。接下来概率最低的一组是B(7)和C(6),所以将他们作为左右子树组成新的根结点BC。在剩下的三个节点中,BC(13)和DE(11)的频率和最低,因此组成新的二叉树BE。最后将仅剩的两个节点合并,并分别为它们分配前缀0和1。这样所有的节点都成为了唯一一个编码树的叶节点。

这个例子中,A的编码长度是1比特,其余字符是3比特。

结果是

相关

  • 斯塔福德斯塔福德郡(英语:Staffordshire,英文简称:Staffs,又译士达福郡),英国英格兰西米德兰兹的郡。皮克区(Peak district)国家公园横跨郡的东北部。以人口计算,特伦特河畔斯托克是第1大城市,
  • 小沙沙漠小沙沙漠(Little Sandy Desert)位于澳大利亚西澳大利亚州,位于大沙沙漠以南,吉布森沙漠以西。因与大沙沙漠相邻、相似,但面积较小,从而得名“小沙沙漠”。它与大沙沙漠在地形地貌
  • 打擂台 (1983年电影)《打擂台》(英语:Flash Future Kung Fu)是黄志强继《舞厅》后的另一出新浪潮电影,于1983年10月21日上映。在未来的世界,人类社会被电脑支配;他们为了寻找生活上的寄托,开始以格斗术
  • 安定连礁安定连礁位于南中国海中沙群岛中沙大环礁南部边缘,东与海鸠暗沙相距约2.4海里,西南与美溪暗沙相距约15海里。整个连礁全部在海面以下,最浅处水深约18米,等深线20米以上面积约1平
  • 特蕾西·舍瓦利耶特蕾西·舍瓦利耶(英语:Tracy Chevalier,1962年10月-)是一名畅销历史小说家。现在与她丈夫及两名孩子在英国伦敦生活。她出生于美国华盛顿首府,在马里兰州的贝塞斯达完成了高中之
  • 福余卫福余卫,明朝兀良哈三卫之一。洪武二十二年(1389年)置。因地在古夫余国得名。辖境初在今黑龙江省嫩江下游一带,其首领是元太祖弟弟铁木哥斡赤斤的后裔。宣德、正统后南迁至今辽宁
  • 中国科学探险协会中国科学探险协会是中华人民共和国科学探险工作者组成的群众性学术团体,是中国科学技术协会主管的社会团体,1989年在北京市成立。
  • 上官河上官河,位于中华人民共和国江苏省,是里下河水网南部的一条南北向河道,南起江苏省兴化市卤汀河(昭阳镇),向北注入兴化市兴盐界河(古殿保)。全长28.6公里。河道功能为排涝、供水、饮用
  • 赤蠵龟赤.mw-parser-output ruby.zy{text-align:justify;text-justify:none}.mw-parser-output ruby.zy>rp{user-select:none}.mw-parser-output ruby.zy>rt{font-feature-settings:"ruby"1;padding:0 0.1em;user-select:none}蠵(xī)龟(学名:),又称为红海龟、红蠵龟、日头龟、八卦龟、火龟,是海龜科蠵龟属下的唯一一个种,分布于世
  • AchtungAchtung(악퉁)是韩国的三人乐团。乐团仅包括吉他、鼓和贝斯,以摇滚即pop为基础,并融入各式风格于他们音乐中。曲风从放克摇滚(英语:Funk rock)一直到令人心碎的抒情曲。他们融合不同的音乐元素,创造其独特音乐风格。Achtung源自德文,有“attention”以及 “warning”的含意。Achtung在2002年的德国高速公路上随处可见。当时,正在德国旅行的乐团创办人秋升烨的车子抛锚在德国高速公路上,一路上Achtung的警告标示在他心中留下永恒的印象。