IEEE 754-2008

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 24 august 2019; verificările necesită 22 de modificări .

IEEE 754 ( IEC 60559) este un standard IEEE utilizat pe scară largă care descrie un format pentru reprezentarea numerelor în virgulă mobilă . Este utilizat în implementări software ( compilatoare ale diferitelor limbaje de programare ) și hardware ( CPU și FPU ) ale operațiilor aritmetice (operații matematice).

Standardul descrie:

format de număr în virgulă mobilă : mantisă , exponent (exponent), semn numeric;
reprezentarea zero pozitiv și negativ , infinit pozitiv și negativ , precum și non -număr ( în engleză Not-a-Number, NaN );
metode folosite pentru a converti un număr la efectuarea operațiilor matematice;
excepții: împărțirea la zero , overflow , underflow , lucru cu numere denormalizate și altele;
operatii: aritmetica si altele.

Standardul din 2008 înlocuiește IEEE 754-1985 . Noul standard include formate binare din standardul anterior și trei formate noi. Conform standardului actual, o implementare trebuie să suporte cel puțin unul dintre formatele de bază, precum și formatul aritmetic și formatul de schimb.

Lista standardelor:

IEEE 754-1985;
IEEE 754-2008.

Dezvoltarea standardului

Versiunea actuală a IEEE 754-2008 a fost publicată în 2008. Acesta completează și înlocuiește versiunea anterioară a IEEE 754-1985 , scrisă de Dan Zuras și editată de Mike Coulishaw..

Standardul internațional ISO/IEC/IEEE 60559:2011 (cu IEEE 754-2008 identic) a fost aprobat și publicat pentru JTC1 /SC 25 conform acordului ISO/IEEE PSDO.

Formatele binare din standardul original sunt incluse în noul standard împreună cu trei formate de bază noi (un binar și două zecimale). Pentru a se conforma standardului actual, o implementare trebuie să implementeze cel puțin unul dintre formatele de bază.

Din septembrie 2015, standardul este revizuit pentru a include clarificări.

Format

Formatul IEEE 754 este „un set de reprezentări de valori numerice și caractere”. Formatul poate include, de asemenea, o metodă de codificare.

Formatul include:

Numere care pot fi considerate în notație binară sau zecimală. Un număr real este reprezentat de trei numere întregi , iar , unde este semnul (0 pentru pozitiv și 1 pentru negativ), este mantisa (coeficientul), este exponentul . Pentru numere întregi date , iar valoarea numărului real corespunzător este: , unde este baza (2 sau 10). De exemplu, un număr cu bază , bit semn (numărul este negativ), mantisă și exponent definesc un număr . $s$ $c$ $q$ $s$ $c$ $q$ $s$ $c$ $q$ $(-1)^{s}\cdot c\cdot b^{q)$ $b$ $zece$ $unu$ $12345$ $-3$ $(-1)^{1}\cdot 12345\cdot 10^{-3}=-12,345$

zero pozitiv și zero negativ . $+0$ $-0$
Două infinitate: și . $+\infty$ $-\infty$
Două tipuri de NaN : NaN silențios (qNaN) și NaN de semnalizare (sNaN). NaN poate transporta o sarcină utilă destinată informațiilor de diagnosticare care indică sursa care a provocat NaN. Semnul NaN nu are sens, dar poate fi previzibil în unele cazuri.

Valorile finale posibile care pot fi reprezentate în format sunt determinate de bază , de numărul de caractere din mantise (cu precizie ) și de valoarea maximă : $b$ $p$ $E_{\max )$

$c$ trebuie să fie un număr întreg în intervalul zero până la (dacă și atunci c poate fi de la până la ) $b^{p}-1$ $b=10$ $p=7$ $0$ $9999999$
$q$ trebuie să fie un număr întreg astfel încât (dacă și , atunci poate fi de la până la ). $1-E_{\max }\leq q+p-1\leq E_{\max }$ $p=7$ $E_{\max }=96$ $q$ $-101$ $90$

Prin urmare (pentru exemplul anterior) cel mai mic număr pozitiv diferit de zero care poate fi reprezentat este , iar cel mai mare este ( ), precum și întreaga gamă de numere de la până la . Numerele și ( și ) sunt cele mai mici (în valoare absolută) numere normale; numerele diferite de zero dintre aceste cele mai mici numere sunt numite subnormale . $1\cdot 10^{-101}$ $9999999\cdot 10^{90}$ ${\displaystyle 9,999999\cdot 10^{96))$ $-9,999999\cdot 10^{-96)$ $9,999999\cdot 10^{-96)$ $-b^{E_{\max ))$ $b^{E_{\max ))$ $-1\cdot 10^{-95}$ $1\cdot 10^{95}$

Reprezentare si codare in memorie

Unele numere pot avea mai multe reprezentări în formatul în care tocmai au fost descrise. De exemplu, dacă și , atunci numărul poate fi reprezentat ca: , sau . $b=10$ $p=7$ $-12.345$ $-12345\cdot 10^{-3)$ $-123450\cdot 10^{-4)$ $-1234500\cdot 10^{-5)$

Pentru formatele zecimale, orice reprezentare este validă, iar colecția acestor reprezentări se numește cohorte . Când un rezultat poate avea mai multe reprezentări, standardul determină care dintre ele este selectată de un membru al cohortei.

Pentru formatele binare, reprezentarea este făcută unică prin alegerea celui mai mic exponent reprezentabil. Pentru numerele cu un exponent în intervalul normal (nu toate sau toate zerourile), bitul de început al mantisei va fi întotdeauna 1. Prin urmare, bitul de început poate fi implicit mai degrabă decât stocat explicit în memorie. Această regulă se numește convenția de biți de conducere sau convenția de biți ascunși. Regula vă permite să salvați 1 bit de memorie pentru a avea încă un bit de precizie. Bitul principal al convenției nu este folosit pentru numere subnormale; rata lor este în afara intervalului normal de valori.

Formate de bază și interschimbabile

Standardul definește cinci formate de bază, care sunt denumite după baza lor numerică și numărul de biți utilizați în codificarea lor. Există trei formate binare de bază în virgulă mobilă (codate cu 32, 64 sau 128 de biți) și două formate zecimale în virgulă mobilă (codificate cu 64 sau 128 de biți). Formatele binary32 și binary64 sunt formatele unice și binare IEEE 754-1985. O implementare conformă trebuie să implementeze pe deplin cel puțin unul dintre formatele de bază.

Standardul definește, de asemenea, formate de schimb care generalizează aceste formate de bază. Cele binare necesită un acord cu biții conducători. Tabelul prezintă cele mai mici formate de schimb (inclusiv cele de bază).

Nume	Titlul complet	Baza	Numărul de cifre binare ale mantisei	Numărul de zecimale	Exponent (bit)	Decimal Emax	Offset exponențial [1]	Emin	Emax	Note
binar16	jumătate de precizie	2	unsprezece	3.31	5	4,51	2 4 −1 = 15	−14	+15	Nu mainstream
binar32	precizie unică	2	24	7.22	opt	38.23	2 7 −1 = 127	−126	+127
binar64	precizie dubla	2	53	15.95	unsprezece	307,95	2 10 −1 = 1023	−1022	+1023
binar128	Precizie cvadruplă	2	113	34.02	cincisprezece	4931,77	2 14 −1 = 16383	−16382	+16383
binar256	Precizie de 8x	2	237	71,34	19	78913.2	2 18 −1 = 262143	−262142	+262143	Nu mainstream
zecimal32		zece	7	7	7,58	96	101	−95	+96	Nu mainstream
zecimal64		zece	16	16	9,58	384	398	−383	+384
zecimal128		zece	34	34	13.58	6144	6176	−6143	+6144

Vă rugăm să rețineți că în tabelul de mai sus, valorile minime sunt pentru numere obișnuite. Reprezentarea specială a numerelor subnormale face posibilă reprezentarea unor numere și mai mici (cu o oarecare pierdere de precizie). De exemplu, cel mai mic număr de precizie dublă mai mare decât zero care poate fi reprezentat în această formă este 2 − 1074 (deoarece 1074 = 1022 + 53 − 1).

Valoarea zecimală este valoarea × log 10 bază , care oferă precizia aproximativă în zecimală.

Decimal E max este emax × log 10 bază, aceasta oferă puterea maximă în zecimală.

După cum sa menționat mai devreme, formatele binary32 și binary64 sunt identice cu formatele IEEE 754-1985 și sunt cele mai comune două formate utilizate în prezent. Figura din dreapta arată precizia absolută pentru formatele binary32 și binary64, variind de la 10 −12 la 10 12 . Un astfel de indicator poate fi utilizat pentru a selecta formatul adecvat, având în vedere valoarea așteptată a numărului și precizia necesară.

Formate de precizie extinse și extensibile

Standardul definește, de asemenea, formate de precizie extinse și extensibile, care sunt recomandate pentru o precizie mai mare decât formatele de bază. Formatul de precizie extinsă extinde formatul de bază folosind o precizie mai mare și o gamă mai largă de exponenți. Formatul avansat de precizie permite utilizatorului să specifice o gamă de precizie și exponent. O implementare poate folosi orice reprezentare internă pe care o alege pentru astfel de formate. Tot ce trebuie specificat sunt parametrii b, p și emax. Acești parametri descriu în mod unic setul de numere finite (combinații de semn și exponent pentru o bază dată) pe care îl poate reprezenta.

Standardul nu necesită o implementare pentru a suporta formate precise extinse sau extensibile.

Standardul recomandă ca limbile să ofere o metodă de specificare a valorilor p și emax pentru fiecare bază acceptată b.

Standardul recomandă ca limbile și implementările să accepte un format extins care are o precizie mai mare decât cel mai mare format de bază acceptat pentru fiecare bază b.

Pentru un format extins cu precizie între două formate de bază, intervalul de exponent trebuie să fie la fel de mare ca cel al următorului format de bază mai larg. Deci, de exemplu, un număr binar de precizie extinsă pe 64 de biți trebuie să aibă o valoare emax de cel puțin 16383.

Formate de schimb

Formatele de schimb sunt concepute pentru a schimba date în virgulă mobilă folosind un șir de biți cu lungime fixă.

Pentru schimbul de numere binare în virgulă mobilă, sunt definite formate de schimb cu lungimea de 16 biți, 32 de biți, 64 de biți și orice multiplu de 32 de biți ≥128. Formatul de 16 biți este destinat schimbului sau stocării de numere mici (de exemplu, pentru calcule grafice sau rețele neuronale).

Schema de codificare pentru aceste formate de schimb binar este aceeași ca și pentru IEEE 754-1985: un bit semn urmat de indici care descriu offset-ul exponentului și p-1 biți care descriu valoarea. Lățimea câmpului exponentului pentru formatul k-biți este calculată ca w = rotund(4 log 2 ( k ))-13. Formatele existente de 64 și 128 de biți urmează această regulă, dar formatele de 16 și 32 de biți au mai mulți biți de putere (5 și respectiv 8 biți) decât oferă această formulă (3 și, respectiv, 7 biți).

Ca și în cazul IEEE 754-1985, există o oarecare flexibilitate în codificarea NaN.

Pentru schimbul de numere zecimale cu virgulă mobilă, formatele de schimb sunt definite pentru orice multiplu de 32 de biți.

Reguli de rotunjire

Standardul definește cinci reguli de rotunjire. Primele două reguli se rotunjesc la cea mai apropiată valoare, celelalte se numesc runde direcționale.

Rotunjire la cea mai apropiată

Rotunjirea la cea mai apropiată (legare „la par”). Dacă cele mai apropiate două numere în virgulă mobilă sunt la fel de apropiate, atunci ar trebui să se obțină numărul cu cifra chiar cea mai mică. Aceasta este valoarea implicită pentru virgulă mobilă binară și cea implicită recomandată pentru zecimală.
Rotunjirea la cea mai apropiată legare („la infinit”). Dacă cele mai apropiate două numere în virgulă mobilă sunt la fel de apropiate, atunci ar trebui să se obțină un număr cu un modul mai mare.

Rotunjire direcțională

Round-to-0 - direcționat rotunjit la zero (cunoscut și ca trunchiere).
Rotunjiți la +∞ - Rotunjiți direcționale la infinit pozitiv (cunoscut și ca rotunjire în sus sau plafon).
Rotunzi la - ∞ - rotunjire direcțională la infinit negativ (cunoscut și ca rotunjire în jos sau etaj).

Exemplu de rotunjire la numere întregi

Mod / Exemplu	+11,5	+12,5	−11,5	−12,5
la cel mai apropiat (se leagă de par)	+12,0	+12,0	−12,0	−12,0
la cel mai apropiat (snap la infinit)	+12,0	+13,0	−12,0	−13,0
la 0	+11,0	+12,0	−11,0	−12,0
la + ∞	+12,0	+13,0	−11,0	−12,0
la - ∞	+11,0	+12,0	−12,0	−13,0

Operațiuni necesare

Operațiunile necesare pentru un format aritmetic acceptat (inclusiv formatele de bază) includ:

Operații aritmetice (adunare, scădere, înmulțire, împărțire, rădăcină pătrată, îmbinare a înmulțirilor multiple, rest)
Conversii (între formate, șiruri de caractere etc.)
Scalare și cuantificare (pentru zecimal)
Copierea și manipularea semnelor (negație, etc.)
Comparație și ordine generală
Clasificare și testare (pentru NaN etc.)
Testați și instalați steaguri
Alte operațiuni

Predicat general

Standardul oferă un predicat totalOrder care definește ordinea totală pentru toate numerele în virgulă mobilă pentru fiecare format. Predicatul este în concordanță cu operațiunile obișnuite de comparație. Cu toate acestea, operațiunile normale de comparare tratează NaN-urile ca neordonate și compară -0 și +0 ca egale. Predicatul totalOrder va ordona aceste cazuri și, de asemenea, va face distincția între diferite reprezentări ale NaN pentru același număr în virgulă mobilă codificat în moduri diferite.

Vezi și

Număr cu jumătate de precizie
Număr unic de precizie
Număr de precizie dublă
Număr cvadruplu
formatul bfloat16(format alternativ de 16 biți, precizie scăzută, dar ușor de convertit din numere de precizie unică)
aritmetica de intervale

Note

↑ Cowlishaw, Mike Decimal Arithmetic Encodings . IBM. Preluat la 6 august 2015. Arhivat din original pe 8 februarie 2016. (nedefinit)

Link -uri

754-2019 - Standard IEEE pentru aritmetica în virgulă mobilă. Revizuirea IEEE Std 754-2008 // ieeexplore.ieee.org, ISBN: 2019 978-1-5044-5924-2, doi:10.1109/IEEEESTD.2019.8766229 (plătit)
754-2008 - Standardul IEEE pentru aritmetica în virgulă mobilă. Revizuirea ANSI/IEEE Std 754-1985 // ieeexplore.ieee.org, 2008 ISBN 978-0-7381-5752-8 , doi:10.1109/IEEEESTD.2008.4610935 (plătit)
Yashkardin V. L. IEEE 754 - un standard pentru aritmetica binară în virgulă mobilă . SoftElectro (2009). (nedefinit)
Convertor IEEE 754
Convertor online binar în zecimal IEEE754

Standardele IEEE

Actual

488
CAMAC
- 575
- 583
- 595
- 596
- 675
- 683
- 726
- 758
696
754
854
Multibus
- 796
- 1296
Programe
- 730
- 828
- 829
- 1012
- 1016
- 1058
- 1063
viitorul autobuz
- 896
- 1156
- 1194
- 1301
960
1003
1014
1076
1101
1149,1
1155
1164
1196
1275
1278
1284
1355
1394
1451
1471
1497
1516
1541-2002
1547
1584
1588
1596
1603
1613
1666
1667
1675
1685
1722
1733
1788
1800
1801
1815
1850
1900.4
1901
1902
1904.1
1905
2030
2050
11073
12207
14764
16085
16326
29148
42010

Seria 802

802.1	D p Q Qat Qay w X ab anunț AE ag Ah ak aq LA FEL DE topor az BA
802,3	-1983 A b d e i j u X y z ab ac anunț ae af Ah ak un aq la av az ba bt de
802.11	modul A b c d e f g h i j k n p r s u v w y ac anunț af Ah ai topor Ay fi

.2
.patru
.5
.6
.7
.opt
.9
.zece
.12
.paisprezece
.cincisprezece
- .unu
- .patru
- .4a
- .6
- .7
.16
- Original d e
.17
.optsprezece
.douăzeci
.21
.22

Seria P

P959

P1363

P1619

P1699

P1823

P1906.1

Înlocuit

754-1985
830
1219
1233
1362
1364
1471

Categorie:Standarde IEEE