基于IEEE 754的浮點(diǎn)數存儲格式分析研究
0引言
本文引用地址:http://dyxdggzs.com/article/202294.htmIEEE(Institute of Electrical and Electronics Engineers,電子電氣工程師協(xié)會(huì ))在I985年制定的IEEE 754(IEEE Standard for Binary Floating-Point Arithmetic, ANSI/IEEE Std 754-1985 )二進(jìn)制浮點(diǎn)運算規范,是浮點(diǎn)運算部件事實(shí)上的工業(yè)標準。許多計算機用戶(hù)有機會(huì )在Intel x86和SPARC 或Power PC機之間交換二進(jìn)制數據,所以對照Intel x86和SPARC結構計算機的數據表示及相關(guān)程序設計語(yǔ)言,討論IEEE 754浮點(diǎn)數存儲格式的細節是有意義的。
本文對浮點(diǎn)數、IEEE 754浮點(diǎn)數的表示方法、規格化處理等進(jìn)行了分析,重點(diǎn)分析、比較了Intel x86和SPARC結構計算機IEEE 754浮點(diǎn)數的存儲格式。
1 浮點(diǎn)數
在計算機系統的發(fā)展過(guò)程中,曾經(jīng)提出過(guò)多種方法表示實(shí)數,但是到目前為止使用最廣泛的是浮點(diǎn)表示法。相對于定點(diǎn)數而言,浮點(diǎn)數利用指數使小數點(diǎn)的位置可以根據需要而上下浮動(dòng),從而可以靈活地表達更大范圍的實(shí)數。
浮點(diǎn)數表示法利用科學(xué)計數法來(lái)表達實(shí)數。通常,將浮點(diǎn)數表示為 ± d.dd…d ×βe,其中d.dd… d 稱(chēng)為有效數字(significand),它具有 p 個(gè)數字(稱(chēng)p位有效數字精度),β為基數(Base),e為指數(Exponent),±表示實(shí)數的正負[1,2]。更精確地,± d0.d1d2…dp-1 × βe, 表示以下數
±(d0+d1β-1+… +dp-1β-(p-1))βe,(0≤di<β)。
對實(shí)數的浮點(diǎn)表示僅作如上的規定是不夠的,因為同一實(shí)數的浮點(diǎn)表示還不是唯一的。例如,1.0×102 ,0.1 ×103 ,和0.01 ×104 都可以表示100.0。為了達到表示單一性的目的,有必要對其作進(jìn)一步的規范。規定有效數字的最高位(即前導有效位)必須非零,即0<d0<β。符合該標準的數稱(chēng)為規格化數(Normalized Numbers),否則稱(chēng)為非規格化數(Denormalized Numbers)。
2 IEEE 754浮點(diǎn)數與其浮點(diǎn)格式 2.1 實(shí)數的IEEE 754表示形式
一個(gè)實(shí)數V在IEEE 754標準中可以用V=(-1)s×M×2E 的形式表示[3,4],說(shuō)明如下:
(1)符號s(sign)決定實(shí)數是正數(s=0)還是負數(s=1),對數值0的符號位特殊處理。
(2)有效數字M(significand)是二進(jìn)制小數,M的取值范圍在1≤M<2或0≤M<1。
(3)指數E(exponent)是2的冪,它的作用是對浮點(diǎn)數加權。
2.2 浮點(diǎn)格式
浮點(diǎn)格式是一種數據結構,它規定了構成浮點(diǎn)數的各個(gè)字段,這些字段的布局,及其算術(shù)解釋[2]。IEEE 754浮點(diǎn)數的數據位被劃分為3個(gè)字段,對以上參數值進(jìn)行編碼:
(1)一個(gè)單獨的符號位s直接編碼符號s。
(2)k位的偏置指數e(e=ek-1…e1e0)編碼指數E,移碼表示。
(3)n位的小數f(fraction)(f=fn-1…f1f0)編碼有效數字M,原碼表示。
2.3 浮點(diǎn)數的分類(lèi)
根據偏置指數e的值,被編碼的浮點(diǎn)數可分成三種類(lèi)型。
(1)規格化數
當有效數字M在范圍1≤M<2中且指數e的位模式ek-1…e1e0既不全是0也不全是1時(shí),浮點(diǎn)格式所表示的數都屬于規格化數。這種情況中小數f(0≤f<1 ) 的二進(jìn)制表示為0. fn-1…f1f0。有效數字M=1+f,即M=1. fn-1…f1f0 (其中小數點(diǎn)左側的數值位稱(chēng)為前導有效位) 。我們總是能調整指數E,使得有效數字M在范圍1≤M<2中,這樣有效數字的前導有效位總是1,因此該位不需顯示表示出來(lái),只需通過(guò)指數隱式給出。
需要特別指出的是指數E要加上一個(gè)偏置值Bias,轉換成無(wú)符號的偏置指數e,也就是說(shuō)指數E要以移碼的形式在存放計算機中。且e、E和Bias三者的對應關(guān)系為e=E+Bias,其中Bias=2k-1-1。
(2)非規格化數
當指數e的位模式ek-1…e1e0全為零(即e=0)時(shí),浮點(diǎn)格式所表示的數是非規格化數。這種情況下,E=1-Bais,有效數字M=f=0. fn-1…f1f0 ,有效數字的前導有效位為0。
非規格化數的引入有兩個(gè)目的。其一是它提供了一種表示數值0的方法,其二是它可用來(lái)表示那些非常接近于0.0的數。
(3)特殊數
當指數e的位模式ek-1…e1e0全為1時(shí),小數f的位模式fn-1…f1f0全為0(即f=0)時(shí),該浮點(diǎn)格式所表示的值表示無(wú)窮,s=0 時(shí)是+∞,s=1時(shí)是-∞。
當指數e的位模式ek-1…e1e0全為1時(shí),小數f的位模式fn-1…f1f0不為0(fn-1、…、f1、f0、至少有一個(gè)非零即f≠0)時(shí),該浮點(diǎn)格式所表示的值被稱(chēng)為NaN(Not a Number)。比如當計算 或∞-∞時(shí)用作返回值,或者用于表示未初始化的數據。
3 IEEE 754浮點(diǎn)存儲格式
與浮點(diǎn)格式對應,浮點(diǎn)存儲格式規定了浮點(diǎn)格式在存儲器中如何存放。IEEE標準定義了這些浮點(diǎn)存儲格式,但具體選擇哪種存儲格式由實(shí)現工具(程序設計語(yǔ)言)決定。
匯編語(yǔ)言軟件有時(shí)取決于所使用的存儲格式,但更高級的語(yǔ)言通常僅處理浮點(diǎn)數據類(lèi)型的語(yǔ)言概念。這些浮點(diǎn)數據類(lèi)型在不同高級語(yǔ)言中有不同的名字,相應的IEEE格式如表1。
表1 IEEE 格式和語(yǔ)言類(lèi)型
IEEE 754標準準確地定義了單精度和雙精度浮點(diǎn)格式,并為這兩種基本格式的分別定義了擴展格式,表1里擴展雙精度格式是IEEE標準定義的擴展雙精度類(lèi)中的一種。
下面詳細討論在Intel x86和SPARC平臺上使用的三種IEEE浮點(diǎn)存儲格式。
3.1 單精度格式
IEEE單精度浮點(diǎn)格式共32位,包含三個(gè)構成字段:23位小數f,8位偏置指數e,1位符號s。將這些字段連續存放在一個(gè)32位字里,并對其進(jìn)行編碼。其中0:22位包含23位的小數f; 23:30位包含8位指數e;第31位包含符號s。如圖1所示。
圖1 單精度存儲格式
評論