汉明码

✍ dations ◷ 2025-09-11 10:25:17 #电信,错误检测与校正

在电信领域中,汉明码(英语:hamming code),也称为海明码,是(7,4)汉明码(英语:Hamming(7,4))推广得到的一种线性纠错码,由理查德·卫斯里·汉明于1950年发明。相比而言,简单的奇偶检验码除了不能纠正错误之外,也只能侦测出奇数个的错误。汉明码是完备码(英语:perfect code),它在于它分组长度相同、最小距离为3的码中能达到最高的码率。

用数学术语来说,汉明码是一种二元线性码。对于所有整数 ≥ 2,存在一个分组长度 = 2 − 1、 = 2 − − 1 编码。因此汉明码的码率为 = / = 1 − / (2 − 1),对于最小距离为3、分组长度为 2 − 1 的码来说是最高的。汉明码的奇偶检验矩阵的是通过列出所有长度为 的非零列向量构成的。

汉明码的发明者理查德汉明在1940年代晚期,运用贝尔模型V(Bell Model V)电脑于贝尔实验室(Bell Labs)工作。输入端是依靠打孔卡(Punched Card),这不免会造成些读取错误。在工作日,当机器检测到错误将停止并闪灯(flash lights),使得操作员能够解决这个错误。在周末和下班期间,没有操作者的情况下,机器只会简单地转移到下一个工作。

汉明在周末工作,他对于不可靠的读卡机发生错误后,总是不得不重新启动程序变得愈来愈沮丧。在接下来的几年中,他为了解决侦错的问题,开发了功能日益强大的侦错算法。在1950年,他发表了今日所称的汉明码,并且时至今日仍在ECC memory上显示其应用价值。

人们在汉明码出现之前使用过多种检查错误的编码方式,但是没有一个可以在和汉明码在相同空间消耗的情况下,得到相等的效果。

奇偶校验是一种添加一个奇偶位用来指示之前的数据中包含有奇数还是偶数个1的检验方式。如果在传输的过程中,有奇数个位发生了改变,那么这个错误将被检测出来(注意奇偶位本身也可能改变)。一般来说,如果数据中包含有奇数个1的话,则将奇偶位设定为1;反之,如果数据中有偶数个1的话,则将奇偶位设定为0。换句话说,原始数据和奇偶位组成的新数据中,将总共包含偶数个1.

奇偶校验并不总是有效,如果数据中有偶数个位发生变化,则奇偶位仍将是正确的,因此不能检测出错误。而且,即使奇偶校验检测出了错误,它也不能指出哪一位出现了错误,从而难以进行更正。数据必须整体丢弃并且重新传输。在一个噪音较大的媒介中,成功传输数据可能需要很长时间甚至不可能完成。虽然奇偶校验的效果不佳,但是由于他只需要一位额外的空间开销,因此这是开销最小的检测方式。并且,如果知道了发生错误的位,若将该位取反,奇偶校验还可以恢复数据。

如果一条信息中包含更多用于纠错的位,且通过妥善安排这些纠错位使得不同的出错位产生不同的错误结果,那么我们就可以找出出错位了。在一个7位的信息中,单个位出错有7种可能,因此3个错误控制位就足以确定是否出错及哪一位出错了。

汉明研究了包括五取二码在内的编码方案,并归纳了他们的想法。

下列通用算法可以为任意位数字产生一个可以纠错一位(英语:Single Error Correcting)的汉明码。

采用奇校验还是偶校验都是可行的。偶校验从数学的角度看更简单一些,但在实践中并没有区别。

校验位一般的规律可以如下表示:

表中只给出了20个编码后的位(5个奇偶校验位,15个数据位)。观察上表可发现一个比较直观的规律:第i个检验位是第2i-1位,从该位开始,检验2i-1位,跳过2i-1位……依次类推。例如上表中第3个检验位p4从第23-1=4位开始,检验4、5、6、7共4位,然后跳过8、9、10、11共4位,再检验12、13、14、15共4位……

要检查某一位的错误,则需检查某一位所包含的所有奇偶校验位。这种错误的模式被叫做伴随式错误。如果所有奇偶校验位是正确的,就没有错误。除此以外的情况,错误的奇偶校验位的位置的和将识别错误的位。例如,如果位置为1、2、8的奇偶校验位指示了一个错误,那么位置为1+2+8=11的位出错了。如果只有一个奇偶校验位指示了错误,那么该奇偶校验位自身出错了。



对11000010进行汉明编码,求编码后的码字。

1.列出表格,从左往右(或从右往左)填入数字,但2的次方的位置不填。

2.把数据行有1的列的位置写为二进制。

3.收集所有二进制数字,求异或。 0011 0101 1011 = 1101 {\displaystyle 0011\oplus 0101\oplus 1011=1101} ,,1,0,,1,1)。

(7,4)汉明码可以很容易地编码为一个(8,4)码,通过在(7,4)编码词()上附加一个额外的奇偶位。

这可以用下面修正的矩阵相加:

注意, H {\displaystyle \mathbf {H} } 并非用标准形式表示。为了得到 G {\displaystyle \mathbf {G} } ,原子行操作能够被用来获得一个等价的矩阵对陈形式的 H {\displaystyle \mathbf {H} }

相关

  • 地舌菌纲地舌菌纲(学名:Geoglossomycetes)是子囊菌门盘菌亚门的一个纲,为一个单型的分类元,其下只有地舌菌目(Geoglossales)一个单型目,而地舌菌目亦只有地舌菌科(Geoglossaceae)一个科。地舌
  • 病因学病原学又称为病因学是形成疾病的因素。因为不同性质的病原,大致上可以分成直接病因与助因两类。直接病因最常见的是创伤,或者是因为感染或辐射暴露导致的疾病。直接病因不一定
  • 波兹曼分布在统计力学与数学中,玻尔兹曼分布(或称吉布斯分布)是系统中的粒子在各种可能微观量子态(英语:microstate (statistical mechanics))的概率分布、概率测度(英语:probability measure),
  • 麦吉尔比尔·麦吉尔 (英语:Bill McGill,1939年9月16日-2014年7月11日),美国篮球运动员。他在1962年NBA选秀中第1轮第1顺位被芝加哥西风选中,现已退役。他与Eric Brach的事迹被写成一本书
  • 圈养圈养就是将动物围在固定的场所人工饲养,它是与天然放牧相对的。圈养在世界上已经存在很长时间,其主要是在禽畜养殖方面,被大量地使用。
  • 楚菜楚菜又称湖北菜、荆菜。楚菜的起源,从屈原在《楚辞》里的两个篇章:“招魂”、“大招”里可得知,因为这两个篇章,记载楚宫佳宴包含20余种楚地名食,为中国历史上最早有用文字来记
  • 桥本氏甲状腺炎桥本氏甲状腺炎也称慢性淋巴细胞性甲状腺炎(chronic lymphocytic thyroiditis)、桥本氏症(Hashimoto's disease)是一种由甲状腺被一系列细胞或抗体介导免疫过程攻击所导致的自
  • 兴达发电厂兴达发电厂位于台湾高雄市永安区与茄萣区交界处,隶属于台湾电力公司,厂区面积135公顷,储煤场面积23公顷,以燃煤为燃料,装机容量432.595万千瓦,北临兴达渔港,南邻永安湿地,位于兴达港
  • 清华同方坐标:40°21′25″N 116°49′10″E / 40.357037°N 116.819504°E / 40.357037; 116.819504同方股份有限公司 (上交所:600100),前称清华同方股份有限公司,母公司是清华控股有限公
  • 白洪锡白洪锡(韩语:백홍석;1890年1月11日-1960年10月4日)日本名德川荣一。朝鲜人,日本陆军军人。大日本帝国陆军士官学校第27期毕业。日本陆军少佐。韩国陆军准将。韩国在乡军人会初任会