香农-范诺编码

✍ dations ◷ 2025-12-07 03:26:39 #香农-范诺编码

在数据压缩的领域里,香农-范诺编码(英语:Shannon–Fano coding)是一种基于一组符号集及其出现的或然率(估量或测量所得)构建前缀码的技术。其名称来自于克劳德·香农和罗伯特·范诺。在编码效率上,它并不能与霍夫曼编码一样实现编码(code word)长度的最低期望;然而,与霍夫曼编码不同的是,它确保了所有的编码长度在一个理想的理论范围 log P ( x ) {displaystyle {-log }P(x)} 之内。这项技术是香农于1948年,在他介绍信息理论的文章“通信数学理论”中提出的。范诺则在不久以后独立地以技术报告形式将其发布。 香农-范诺编码不应该与香农编码混淆,后者的编码方法用于证明Shannon's noiseless coding theorem,或与Shannon–Fano–Elias coding(又被称作Elias coding)一起,被看做算术编码的先驱。

香农-范诺编码将符号从最大可能性到最少可能性排序,并将排列好的信源符号分为两大组,使两组的概率和接近,并各赋予一个二进制符号“0”和“1”。只要有符号剩余,就以同样的过程重复这些步骤以此确定这些代码的连续编码数字。依次下去,直至每一组的只剩下一个信源符号为止。当一组已经仅剩余一个符号,显然,这意味着这一符号的编码是完整的,也不会成为任何其他符号的代码前缀。

香农-范诺编码能够产生相对高效的可变长度编码;对于每一个比特位而言,当两个较小的集合具有恰好相等的概率时,这一方法就能最有效地利用这一位编码的信息。然而,香农-范诺并不总是产生最优的前缀码:例如对概率{0.35,0.17,0.17,0.16,0.15},香农-范诺算法就无法给出理想的编码。出于这个原因,香农-范诺编码几乎从不被使用。

Shannon-Fano编码树是基于一个符号和对应频率的列表建立的。实际的算法很简单:

这个例子展示了一组字母的香农编码结构(如图a所示)这五个可被编码的字母有如下出现次数:

从左到右,所有的符号以它们出现的次数划分。在字母B与C之间划定分割线,得到了左右两组,总次数分别为22、17,这样就把两组的差别降到最小。通过这样的分割,A与B同时拥有了一个以0为开头的编码,C、D、E的前缀则为1,如图b所示。随后,在树的左半边,于A、B间建立新的分割线,这样A就成为了编码为00的叶子节点,B的编码为01。经过四次分割,得到了一个树形编码。如下表所示,在最终得到的树中,拥有最大频率的符号被两位编码,其他两个频率较低的符号被三位编码。

根据A,B,C两位编码长度,D,E的三位编码长度,最终的平均码字长度是

香农-范诺编码算法并非总能得到最优编码。1952年, David A. Huffman提出了一个不同的算法,这个算法可以为任何的可能性提供出一个理想的树。香农-范诺编码是从树的根节点到叶子节点所进行的的编码,霍夫曼编码算法却是从相反的方向,暨从叶子节点到根节点的方向编码的。

用以上Shannon - Fano例子所使用的分析,即:

首先将D、E合并,它们频率和为11(图a至图b)。接下来概率最低的一组是B(7)和C(6),所以将他们作为左右子树组成新的根结点BC。在剩下的三个节点中,BC(13)和DE(11)的频率和最低,因此组成新的二叉树BE。最后将仅剩的两个节点合并,并分别为它们分配前缀0和1。这样所有的节点都成为了唯一一个编码树的叶节点。

这个例子中,A的编码长度是1比特,其余字符是3比特。

结果是

相关

  • 伯克氏菌属等伯克氏菌属,或伯克氏菌,又译伯克霍尔德菌(学名:Burkholderia),是伯克氏菌科的一个属,这个属下最出名的有鼻疽伯克氏菌(B. mallei),是一种会在马或其他相关动物身上引起马鼻疽的病菌;
  • 废除死刑的国家或地区阿富汗(英语:Capital punishment in Afghanistan) · 巴哈马(英语:Capital punishment in the Bahamas) · 白俄罗斯 · 博茨瓦纳 · 中华人民共和国(罪名 · 死刑犯) · 古巴(
  • 西格巴恩凯·曼内·伯耶·西格巴恩(瑞典语:Kai Manne Börje Siegbahn,1918年4月20日-2007年7月20日)是瑞典物理学家及1981年诺贝尔物理学奖得奖者之一。他的父亲曼内·西格巴恩曾获1924
  • 左岸 (法国)在法国巴黎地区,左岸(法语:La Rive Gauche,法语发音:.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Cod
  • 征韩论征韩论(日语:せいかんろん,韩语:정한론),在日本幕末至明治初期,当时留守政府的领导者(未有随岩仓使节团出访欧美的维新领袖),如西乡隆盛(学者毛利敏彦认为,西乡本身并非主张对韩出兵,而是
  • 崇阳街道崇阳街道,原为崇阳镇,是中华人民共和国四川省成都市崇州市下辖的一个乡镇级行政单位。2019年12月,将崇阳街道仁里社区、三和社区、白碾社区、朱氏街社区、西桥社区、彭庙村、水
  • 泥金彩漆泥金彩漆是浙江省宁波市的一项传统手工艺,其主要特色为泥金工艺和彩漆工艺的有机结合,亦与朱金木雕、金银彩绣并称宁波传统工艺“三金”。其作品大到床笫橱柜,小到提桶果盒,应用
  • 稻垣吾郎稻垣吾郎(1973年12月8日-),日本男演员及男歌手,已解散的日本偶像组合SMAP的前成员。与木村拓哉、香取慎吾同日进杰尼斯事务所。因组合SMAP于2016年12月31日解散而以个人身份进行活动。 2017年9月8日正式与杰尼斯事务所解约。 2017年9月22日,宣布与新经纪公司CULEN Inc.签约,并开设个人全新官网。大多数属于个人主演为主、SMAP共演与个人客串为副每集从不同角度看鬼故事,请大师解析心灵写真照。※此剧获得2004亚洲电视大赏最佳实况剧。SMAP共同演出,轮流当主角请参看SMAP的
  • 毕比·纽沃思比阿特丽斯·“毕比”·纽沃思(英语:Beatrice "Bebe" Neuwirth,1958年12月31日-),女,美国演员、歌手和舞者,在美剧《欢乐酒店》中饰演Dr. Lilith Sternin一角而出名,另外,她参与演出的芭蕾舞剧有《彼得与狼》、《胡桃夹子》等,剧目有《游戏6》、《夏威夷生死斗》等。纽沃思是犹太人,出生于新泽西州普林斯顿。5岁的时候开始学芭蕾舞。1976年毕业于普林斯顿高中1976年到1977年在纽约茱莉亚学院学习,并选择了芭蕾舞专业。在那期间,她参与表演《彼得与狼》、《胡桃夹子》
  • 凯德里克·布朗阿尔伯特·凯德里克·布朗(英语:Albert Kedrick Brown,1981年3月18日-),美国NBA联盟职业篮球运动员。他在2001年的NBA选秀中第1轮第11顺位被波士顿凯尔特人选中。