浮点数

✍ dations ◷ 2024-07-05 15:21:06 #浮点数
在计算机科学中,浮点(英语:floating point,缩写为FP)是一种对于实数的近似值数值表现法,由一个有效数字(即尾数)加上幂数来表示,通常是乘以某个基数的整数次指数得到。以这种表示法表示的数值,称为浮点数(floating-point number)。利用浮点进行运算,称为浮点计算,这种运算通常伴随着因为无法精确表示而进行的近似或舍入。计算机使用浮点数运算的主因,在于电脑使用二进位制的运算。例如:4÷2=2,4=100(2)、2=010(2),在二进制相当于退一位数。则1.0÷2=0.5=0.1(2)也就是 1 2 {displaystyle {frac {1}{2}}} 。依此类推二进制的0.01(2)就是十进制 1 2 2 {displaystyle {frac {1}{2^{2}}}} = 1 4 {displaystyle {frac {1}{4}}} =0.25。由于十进位制无法准确换算成二进位制的部分小数,如0.1,因此只能使用近似值的方式表达。这种表示方法类似于基数为10的科学记数法,在计算机上,通常使用2为基数的幂数来表示。一个浮点数a由两个数m和e来表示:a = m × be。在任意一个这样的系统中,我们选择一个基数b(记数系统的基)和精度p(即使用多少位来存储)。m(即尾数)是形如±d.ddd...ddd的p位数(每一位是一个介于0到b-1之间的整数,包括0和b-1)。如果m的第一位是非0整数,m称作正规化的。有一些描述使用一个单独的符号位(s 代表+或者-)来表示正负,这样m必须是正的。e是指数。这种表示法的设计,来自于对于值的表现范围,与精密度之间的取舍:可以在某个固定长度的存储空间内表示出某个实数的近似值。例如,一个指数范围为±4的4位十进制浮点数可以用来表示43210,4.321或0.0004321,但是没有足够的精度来表示432.123和43212.3(必须近似为432.1和43210)。当然,实际使用的位数通常远大于4。此外,浮点数表示法通常还包括一些特别的数值:+∞和−∞(正负无穷大)以及NaN('Not a Number')。无穷大用于数太大而无法表示的时候,NaN则指示非法操作或者无法定义的结果。其中,无穷大,可表示为inf,在内存中的值是阶码为全1,尾数全0。而NaN在内存中的值则是阶码全1,尾数不全0。浮点指的是带有小数的数值,浮点运算即是小数的四则运算,常用来测量电脑运算速度。大部分计算机采用二进制(b=2)的表示方法。位(bit)是衡量浮点数所需存储空间的单位,通常为32位或64位,分别被叫作单精度和双精度。有一些计算机提供更大的浮点数,例如英特尔公司的浮点运算单元Intel8087协处理器(以及其被集成进x86处理器中的后代产品)提供80位长的浮点数,用于存储浮点运算的中间结果。还有一些系统提供128位的浮点数(通常用软件实现)。在电脑使用的浮点数被电气电子工程师协会(IEEE)规范化为IEEE 754。π的值可以表示为π = 3.1415926...10(十进制)。当在一个支持17位尾数的计算机中表示时,它会变为0.11001001000011111 × 22。由于浮点数不能表达所有实数,浮点运算与相应的数学运算有所差异,有时此差异极为显著。比如,二进制浮点数不能表达0.1和0.01,0.1的平方既不是准确的0.01,也不是最接近0.01的可表达的数。单精度(24比特)浮点数表示0.1的结果为 e = − 4 {displaystyle e=-4} , s = 110011001100110011001101 ( 2 ) {displaystyle s=110011001100110011001101_{(2)}} ,即此数的平方是但最接近0.01的可表达的数是浮点数也不能表达圆周率 π {displaystyle pi } ,所以 tan ⁡ π 2 {displaystyle tan {frac {pi }{2}}} 不等于正无穷,也不会溢出。下面的C语言代码的计算结果为16331239353195370.0,如果用单精度浮点数,则结果为−22877332.0。同样的, sin ⁡ π ≠ 0 {displaystyle sin pi neq 0} 。由于浮点数计算过程中丢失了精度,浮点运算的性质与数学运算有所不同。浮点加法和乘法不符合结合律和分配律。Intel Pentium CPU早期的60-100MHz P5版本在浮点运算单元有一个问题,在极少数情况下,会导致除法运算的精确度降低。这个缺陷于1994年被发现,变成如今广为人知的Pentium FDIV bug,同时这一事件导致Intel陷入巨大的窘态,创建召回项目来回收有问题的处理器。

相关

  • 替米沙坦(必康平,Micardis)替米沙坦(国际非专利药品名称:Telmisartan) 是一种血管紧张素II受体拮抗剂(英语:ARB),用于治疗高血压。现时大部分降血压药的疗效最长只能维持10小时。 替米沙坦 (Telmisartan) 的
  • 肌肉肌肉(拉丁语:Musculus)是一种能收缩的动物组织,属于软组织,由胚胎的中胚层发育而来。肌肉细胞有收缩纤维,会在细胞间移动,并改变细胞的大小。肌肉分为骨骼肌、心肌和平滑肌三种,其功
  • 伊利阿斯·马格努斯·弗里斯埃利亚斯·芒努斯·弗里斯(瑞典语:Elias Magnus Fries,1794年8月15日-1878年2月8日),瑞典生物学家。他在六十多年的科研生涯中,搜集了欧洲各地大量的真菌标本,对其进行了科学、系统
  • 脑膜脑膜(拉丁语:meninges /məˈnɪndʒiːz/,单数:meninx /ˈmɛnɪŋks/)是包裹大脑和脊髓的三层保护薄膜。在哺乳动物身上,脑膜指的是硬脑膜(英语:dura mater)、蛛网膜(英语:arachnoid
  • 库特伯·迪·息拉辛库特布丁·设拉子(Qutb al-Din Shirazi)(1236年-1311年2月7日)是13世纪波斯学者,对伊斯兰科学和哲学多有贡献。出生于设拉子,其父亲为名医和苏菲派长老,自幼从父学医,曾专研伊本·西
  • 伊本·西那阿布·阿里·侯赛因·本·阿卜杜拉·本·哈桑·本·阿里·本·西那(阿拉伯文:أبو علي الحسين بن عبد الله بن الحسن بن علي بن سينا
  • 测绘学形貌测绘学研究测定和推算地面几何位置、地球形状及地球重力场,据此测量地球表面自然物体和人工设施的几何分布,编制各种比例尺地图的理论和技术的学科。测绘学的研究对象是地球的
  • 蚕豆Faba sativa Moench.蚕豆(学名:Vicia faba)是一年生或越年生豆科草本植物,又名胡豆、佛豆、川豆、倭豆、罗汉豆,原产亚洲西南部和非洲北部。相传西汉张骞出使西域时期传入中国,8世
  • 凯旋级核潜艇凯旋级核潜艇(法语:Classe Le Triomphant)是法国海军现役的弹道导弹核潜艇,共有4艘,分别于1997、1999、2004及2010年服役。四艘核潜艇取代原有的六艘可畏级核潜艇,成为法国核慑力
  • 插入插入(英语:Insertion)是指一个或多个核苷酸碱基对插入DNA序列中,经常发生于微卫星区域。若以染色体层次来说,则是指一段染色体片段插入另一条染色体,常发生在减数分裂时,染色体发生