有符号数处理

✍ dations ◷ 2025-07-09 15:13:59 #有符号数处理

在计算机运算中,有符号数的表示(英语:signed number representations)需要将负数编码为二进制形式。

在数学中,任意基数的负数都在最前面加上“−”符号来表示。然而在计算机硬件中,数字都以无符号的二进制形式表示,因此需要一种编码负号的方法。当前有四种方法,用于扩展二进制数字系统,来表示有符号数:原码(sign-and-magnitude)、反码(ones' complement)、补码(two's complement)以及移码(offset binary,excess-)。

符号及值(sign & magnitude)的处理办法是分配一个符号位(sign bit)来表示这个符号:设置这个位(通常为最高有效位)为表示一个正数,为表示一个负数。数字中的其它位指示数值(或者绝对值)。因此一个字节只有7位(除去符号位),数值的范围从0000000(0)到1111111(127)。这样当你增加一个符号位(第八位)后,可以表示从−12710到+12710的数字。这种表示法导致的结果就是可以有两种方式表示零,00000000(0)与10000000(−0),这大大增加数字电路的复杂性和设计难度。CPU亦须执行两次比较,来测试运算结果是否为零。

十进制数−43用原码方法编码成八位的结果为10101011。

这种方法被直接比较于常用的符号表示法(放置一个“+”或者“−”在数字的数值之前)。一些早期的二进制电脑(例如IBM 7090)使用这种表示法,也许是由于它与通用用途的自然联系。原码是最常用的表示浮点数的方法。IEEE二进制浮点数算术标准(IEEE 754)采用最高有效位作为符号位,因此可表示正负零及正负无限。

另一方面,一种叫做反码(ones' complement)的系统也可以用于表示负数(注:正数与原码形式一样,无需取反)。一个负数的二进制数反码形式为其绝对值部分按位取反(即符号位不变,其余各位按位取反)。同原码表示一样,0的反码表示形式也有两种:00000000(+0)与11111111(−0)。

举例来说,原码10101011(-43)的反码形式为11010100(−43)。有符号数用反码表示的范围为−(2N−1−1)到(2N−1−1),以及+/−0。一个惯常的八位的字节便是(可表示)−12710到+12710,以及00000000(+0)或者11111111(−0)。

对两个反码表示形式的数字做加法,首先需要进行常规的二进制加法,但还需要在和的基础上加上进位。为什么必须这样呢?来看下面这个−1加上+2的例子。

       二进制    十进制    11111110     -1 +  00000010     +2............    ...  1 00000000      0   <-- 错误答案           1     +1   <-- 加上进位............    ...    00000001      1   <-- 正确答案

在上面的例子中,二进制加法仅仅得到了00000000,这是一个错误的答案。只有当加上进位时才能得到正确答案(00000001)。

反码这种数字表示系统通常出现在老式的计算机中;PDP-1,CDC 160A,UNIVAC 1100/2200系列以及其它的一些电脑都使用反码算术。

关于正字法(orthography)的评述:这个系统之所以被称作反码(ones' complement)是因为一个正值的反(表示为按位非)也可以通过0的反码(ones' complement)表示形式(一长串的1,−0)减去得到。

Internet协议IPv4,ICMP,UDP以及TCP都使用同样的16位反码检验和算法。虽然大多数计算机缺少“循环进位”硬件,但是这种额外的复杂性是可以接受的,因为“对于所有位(bit)位置上的错误都是同样敏感的”。 在UDP中,全0表示省略了可选的检验和特性。另外一种表示:FFFF,指示了0的检验和。 (在IPv4中,TCP和ICMP都强制性地规定了检验和,而在IPv6中可以省略)。

注意负数的反码只需按位求数值的补码就可以得到,符号不需要变动。

补码(two's complement)回避了0有多种表示的问题以及循环进位的需要。在补码表示中,负数以位模式表示为正值的反码加1(当作无符号数)。

在补码表示中,只有一个0(00000000)。求一个数的补码(无论是负数还是正数)需要反转所有位,然后加1。一对补码整数相加等价于一对无符号数相加(除了溢出检测,如果能够做到的话)。比如,从旁边的表格可以看出,127与−128的补码表示相加就与无符号数127及128相加具有相同的结果。

从一个正数得到其对应负数的补码的简单方法表示如下:

移码(offset binary),是将二进制原码无符号整数所代表的值,减去一个预设值。

标准移码,预设值为二进制原码表示的最大整数的一半。 一个数的标准移码和补码,最高位相反,其余各位均相同。

下表列出了 4-bit 二进数所能表示的整数:

相关

  • 郎格罕细胞朗格汉斯细胞(又称兰氏细胞)是在皮肤和黏膜的树状细胞(抗原呈递细胞),其中含有称作伯贝克颗粒(英语:Birbeck granules)的胞器,在上皮中的任何一层都有朗格汉斯细胞,不过主要是在棘状
  • 杰瑞·布朗小埃德蒙·杰拉尔德·“杰里”·布朗(Edmund Gerald "Jerry" Brown, Jr.,1938年4月7日-),美国政治人物,美国民主党人。前任加利福尼亚州州长,曾在1975年到1983年及2011年到2019年两
  • 内阴动脉内阴动脉(Arteria pudenda interna)源自于内髂动脉(英语:internal iliac artery),为三条阴部动脉(英语:pudendal arteries)的其中一条。内阴动脉负责供养外生殖器的血流。内阴动脉为
  • 日向雏田日向雏田(日向ヒナタ,Hyuuga Hinata) 是日本漫画《火影忍者》系列中的一个人物,日向宗家的白眼公主,于《THE LAST》片尾,《疾风传》720集中与漩涡鸣人结婚,改名为漩涡雏田(うずまき
  • 范白虎范白虎(越南语:Phạm Bạch Hổ/.mw-parser-output .han-nom{font-family:"Nom Na Tong","Han-Nom Gothic","Han-Nom Ming","HAN NOM A","HAN NOM B","Ming-Lt-HKSCS-UNI-H","M
  • 龙兄鼠弟 (电影)《龙兄鼠弟》(英语:)是一部由伊万·雷特曼编剧、导演及担任制片人的喜剧电影,身高1.88米的阿诺德·施瓦辛格和身高1.52米的丹尼·德维托在片中扮演一对双胞胎。这也是施瓦辛格所
  • 巴啦啦小魔仙之魔法的考验《巴啦啦小魔仙之魔法的考验》(英语:)是中华人民共和国真人魔法电影《巴啦啦小魔仙大电影的续集》制作单位于2013年拍摄2014年推出的第二部电影版。魔仙小蓝和美琪、美雪无意闯
  • 希贝尼克-克宁县西本斯克-库宁斯卡县(克罗地亚语:Šibensko-kninska županija,.mw-parser-output .IPA{font-family:"Charis SIL","Doulos SIL","Linux Libertine","Segoe UI","Lucida Sans Unicode","Code2000","Gentium","Gentium Alternative","TITUS Cyberbit Basic","Arial Unicode MS","IPAPANNEW","Ch
  • 尸魂界尸魂界(Soul Society)是日本漫画家久保带人所创作的漫画《BLEACH》中的一个世界,是死神和魂魄所居住并存在一百万年以上的世界,包括位于中央的由贵族和死神所居住的瀞灵廷,以及环绕净灵廷的其他魂魄所居住的流魂街两部分。尸魂界类似于天堂或极乐世界。根据朽木露琪亚(朽木白哉的妹妹)所说,尸魂界中九成以上的地区都比现世好,而且来到尸魂界的魂魄身体也会变得很轻盈。实际上尸魂界存在着阶级制度,并且存在饥饿和邪恶等,和现世很相似。在尸魂界中没有谁能够永生,人们以与现世相比更慢的速度逐渐变老、最终死去,也有可
  • 井上公平井上公平(1978年10月5日-),前日本足球运动员。