香农-范诺编码

✍ dations ◷ 2025-11-23 05:52:11 #香农-范诺编码

在数据压缩的领域里,香农-范诺编码(英语:Shannon–Fano coding)是一种基于一组符号集及其出现的或然率(估量或测量所得)构建前缀码的技术。其名称来自于克劳德·香农和罗伯特·范诺。在编码效率上,它并不能与霍夫曼编码一样实现编码(code word)长度的最低期望;然而,与霍夫曼编码不同的是,它确保了所有的编码长度在一个理想的理论范围 log P ( x ) {displaystyle {-log }P(x)} 之内。这项技术是香农于1948年,在他介绍信息理论的文章“通信数学理论”中提出的。范诺则在不久以后独立地以技术报告形式将其发布。 香农-范诺编码不应该与香农编码混淆,后者的编码方法用于证明Shannon's noiseless coding theorem,或与Shannon–Fano–Elias coding(又被称作Elias coding)一起,被看做算术编码的先驱。

香农-范诺编码将符号从最大可能性到最少可能性排序,并将排列好的信源符号分为两大组,使两组的概率和接近,并各赋予一个二进制符号“0”和“1”。只要有符号剩余,就以同样的过程重复这些步骤以此确定这些代码的连续编码数字。依次下去,直至每一组的只剩下一个信源符号为止。当一组已经仅剩余一个符号,显然,这意味着这一符号的编码是完整的,也不会成为任何其他符号的代码前缀。

香农-范诺编码能够产生相对高效的可变长度编码;对于每一个比特位而言,当两个较小的集合具有恰好相等的概率时,这一方法就能最有效地利用这一位编码的信息。然而,香农-范诺并不总是产生最优的前缀码:例如对概率{0.35,0.17,0.17,0.16,0.15},香农-范诺算法就无法给出理想的编码。出于这个原因,香农-范诺编码几乎从不被使用。

Shannon-Fano编码树是基于一个符号和对应频率的列表建立的。实际的算法很简单:

这个例子展示了一组字母的香农编码结构(如图a所示)这五个可被编码的字母有如下出现次数:

从左到右,所有的符号以它们出现的次数划分。在字母B与C之间划定分割线,得到了左右两组,总次数分别为22、17,这样就把两组的差别降到最小。通过这样的分割,A与B同时拥有了一个以0为开头的编码,C、D、E的前缀则为1,如图b所示。随后,在树的左半边,于A、B间建立新的分割线,这样A就成为了编码为00的叶子节点,B的编码为01。经过四次分割,得到了一个树形编码。如下表所示,在最终得到的树中,拥有最大频率的符号被两位编码,其他两个频率较低的符号被三位编码。

根据A,B,C两位编码长度,D,E的三位编码长度,最终的平均码字长度是

香农-范诺编码算法并非总能得到最优编码。1952年, David A. Huffman提出了一个不同的算法,这个算法可以为任何的可能性提供出一个理想的树。香农-范诺编码是从树的根节点到叶子节点所进行的的编码,霍夫曼编码算法却是从相反的方向,暨从叶子节点到根节点的方向编码的。

用以上Shannon - Fano例子所使用的分析,即:

首先将D、E合并,它们频率和为11(图a至图b)。接下来概率最低的一组是B(7)和C(6),所以将他们作为左右子树组成新的根结点BC。在剩下的三个节点中,BC(13)和DE(11)的频率和最低,因此组成新的二叉树BE。最后将仅剩的两个节点合并,并分别为它们分配前缀0和1。这样所有的节点都成为了唯一一个编码树的叶节点。

这个例子中,A的编码长度是1比特,其余字符是3比特。

结果是

相关

  • 柔性印刷电路板柔性印刷电路板(Flexible Printed Circuit,FPC)又称为柔性线路板、软性电路板、软性线路板、挠性线路板、软板等,是一种特殊的印制电路板。它的特点是重量轻、厚度薄、柔软、可
  • 卡里斯·范·豪滕卡里斯·范·豪滕(Carice Anouk van Houten,发音为/karis anuk fɑn ˈhʌutɛn/,1976年9月5日-)一位荷兰女演员与歌手。自2012年在美国电视剧集《权力游戏》中饰演红袍女巫一角
  • 怀疑派化学家出版于1661年的《怀疑派化学家》(英语:The Sceptical Chymist),作者是英国化学家罗伯特·波义耳(Robert Boyle,1627-1691)。本书是现代实验科学的里程碑。
  • 全画幅全画幅(或称全片幅、135、35mm,英语:Full Frame,德语:Kleinbild Film)是一个基于商业使用的摄影术语,指的是感光面积为36×24 mm尺寸大小的规格。这一规格用于描述镜头的成像圈指标
  • 卡尔·夏菲卡尔·夏菲(Karl Schäfer,1909年5月17日-1976年4月23日),奥地利花样滑冰与游泳运动员。曾于花样滑冰项目获得两届奥运冠军(1932、1936)、七届世界锦标赛冠军(1930-1936)与八届欧洲锦
  • 毕师铎毕师铎(9世纪?-888年3月2日),原是黄巢的大将,乾符五年(879年)高骈派大将张璘、梁缵等人,分道出击黄巢,毕师铎投降高骈,任淮南左厢都知兵马使。高骈得知秦宗权将侵略淮南,遣毕师铎率百骑
  • 美西航空美西航空(英语:America West Airlines)是一家曾存在于1981年至2007年之间的美国低成本航空公司(LCC),总部设于亚利桑那州坦佩(Tempe, AZ),并以凤凰城天港国际机场作为枢纽机场。美西
  • CSMCSM(英语:Certified Scrum Master,Certified为认证之义),是Scrum软件开发中的认证,是由Scrum Alliance所认证,此一认证需理解Scrum开发的精神,并且可以实践及应用Scrum。Scrum Maste
  • 赫本赫本(冰岛语:Höfn)是冰岛南部区霍尔纳菲厄泽(冰岛语:Sveitarfélagið Hornafjörður)市镇内的一个渔镇,邻近霍尔纳潟湖(英语:Hornafjörður)与瓦特纳冰原。该城市在冰岛东南部为第二大渔村,在1994到1998期间又被称作“Hornafjarðarbær”。赫本位于冰岛东南方一座半岛上,该名称在冰岛语意旨渔港,港口三面环海,为冰岛东南方最长的海岸线港口。,由于周围河流的影响,整个半岛位于一潟湖内。,除半岛外,赫本周围还有许多岛屿,其中最大的岛屿为“Mikley”,第二大
  • 南河三南河三(亦作小犬座α,简写为α CMi)是一颗视星等为0.34的恒星,位于小犬座。其为恒星亮度列表中第9亮的恒星,同时也是该星座最亮的恒星。但据现代观测手段,南河三实为由两颗恒星组成的联星系统,其主星为南河三A,一颗白色F5 IV–V型主序星,伴星为南河三B,一颗DQZ型白矮星。根据由欧洲空间局发射的依巴谷卫星所测量的数据计算,该联星系统距太阳系约11.46光年(3.51秒差距),因此其亦属于邻近恒星。南河三的绝对星等为2.66,其自身亮度并不出众,但由于其距离太阳系较近,因此成为了夜空中第8亮的恒星。该