SSE

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 19 februarie 2021; verificările necesită 5 modificări .

SSE ( Streaming SIMD Extensions , extensia SIMD de streaming a procesorului) este SIMD - ( ing . Single Instruction, Multiple Data , One instruction - a lot of data) un set de instrucțiuni dezvoltat de Intel și introdus pentru prima dată în procesoarele din seria Pentium III ca un răspuns la un set de instrucțiuni similar 3DNow! de la AMD , care a fost introdus cu un an mai devreme. Numele original al acestor instrucțiuni a fost KNI - Katmai New Instructions (Katmai este numele primei versiuni a nucleului procesorului Pentium III ).

Tehnologia SSE a făcut posibilă depășirea a două probleme principale ale MMX : atunci când se folosea MMX, era imposibil să se utilizeze simultan instrucțiunile coprocesorului , deoarece registrele sale erau partajate cu registrele MMX și capacitatea MMX de a lucra numai cu numere întregi.

SSE include opt registre de 128 de biți și un set de instrucțiuni care funcționează cu tipuri de date scalare și împachetate în arhitectura procesorului .

Avantajul de performanță este atins atunci când este necesară efectuarea aceleiași secvențe de acțiuni pe date diferite. În acest caz, blocul SSE paralelizează procesul de calcul între date.

Caracteristici

8 (în x86-64 - 16) registre XMM pe 128 de biți.
Registrul de steag pe 32 de biți (în x86-64 - 64) (MXCSR).
Tip de date în virgulă mobilă cu precizie unică, ambalate pe 128 de biți .
Instrucțiuni privind numerele reale cu precizie unică.
Instrucțiuni pentru preîncărcarea explicită a datelor, controlul stocării în cache a datelor și controlul ordinii operațiilor de salvare.

Registre

Opt (șaisprezece pentru x64) registre pe 128 de biți au fost adăugate la SSE, numite xmm0 - xmm7 (-xmm15).

Fiecare registru poate conține patru valori cu virgulă mobilă de precizie unică de 32 de biți.

Comenzi SSE

Comenzi pentru numere în virgulă mobilă

Înainte comenzi
- Tipuri scalare - MOVSS
- Tipuri ambalate - MOVAPS, MOVUPS, MOVLPS, MOVHPS, MOVLHPS, MOVHLPS
Comenzi aritmetice
- Tipuri scalare - ADDSS, SUBSS, MULSS, DIVSS, RCPSS, SQRTSS, MAXSS, MINSS, RSQRTSS
- Tipuri de pachete - ADDPS, SUBPS, MULPS, DIVPS, RCPPS, SQRTPS, MAXPS, MINPS, RSQRTPS
Comenzi de comparare
- Tipuri scalare - CMPSS, COMISS, UCOMISS
- Tipuri ambalate - CMPPS
Amestecare și despachetare
- Tipuri ambalate - SHUFPS, UNPCKHPS, UNPCKLPS
Tastați Comenzi de conversie
- Tipuri scalare - CVTSI2SS, CVTSS2SI, CVTTSS2SI
- Tipuri ambalate - CVTPI2PS, CVTPS2PI, CVTTPS2PI
Operații booleene pe biți
- Tipuri ambalate - ANDPS, ORPS, XORPS, ANDNPS

Comenzi pentru numere întregi

Comenzi aritmetice
- PMULHUW, PSADBW, PAVGB, PAVGW, PMAXUB, PMINUB, PMAXSW, PMINSW
Înainte comenzi
- PEXTRW, PINSRW
Alte
- PMOVMSKB, PSHUFW

Alte comenzi

Lucrul cu Registrul MXCSR
- LDMXCSR, STMXCSR
Gestionarea memoriei cache și a memoriei
- MOVNTQ, MOVNTPS, MASKMOVQ, PREFETCH0, PREFETCH1, PREFETCH2, PREFETCHNTA, SFENCE

Exemplu

Următorul exemplu arată înmulțirea a patru perechi de numere în virgulă mobilă cu o instrucțiune mulps :

__declspec ( align ( 16 )) float a [ 4 ] = { 300.0 , 4.0 , 4.0 , 12.0 }; __declspec ( align ( 16 )) float b [ 4 ] = { 1.5 , 2.5 , 3.5 , 4.5 }; __asm { movups xmm0 , a ; // pune 4 variabile în virgulă mobilă din a în registrul xmm0 movups xmm1 , b ; // pune 4 variabile în virgulă mobilă din b în registrul xmm1 mulps xmm0 , xmm1 ; // înmulțim pachetele cu virgulă mobilă: xmm0 = xmm0 * xmm1 ; // xmm00 = xmm10 * xmm00 ; // xmm01 = xmm11 * xmm01 ; // xmm02 = xmm12 * xmm02 ; // xmm03 = xmm13 * xmm03 movups a , xmm0 ; // descărcați rezultatele din registrul xmm0 la adresele a };

Același exemplu, dar inserția de asamblare asm este realizată în standardul AT&T (GNU Assembler)

float a [ 4 ] = { 300.0 , 4.0 , 4.0 , 12.0 }; float b [ 4 ] = { 1,5 , 2,5 , 3,5 , 4,5 }; __asm__ volatile ( "movups %[a], %%xmm0 \n\t " // pune 4 variabile cu virgulă mobilă din a în registrul xmm0 "movups %[b], %%xmm1 \n\t " // pune 4 variabile cu virgulă mobilă de la b pentru a înregistra xmm1 "mulps %%xmm1, %%xmm0 \n\t " // înmulțirea pachetelor cu virgulă mobilă: xmm0 = xmm0 * xmm1 // xmm00 = xmm00 * xmm10 // xmm01 = xmm01 * xmm11 // xmm02 = xmm02 * xmm12 // xmm03 = xmm03 * xmm13 "movups %%xmm0, %[a] \n\t " // dump rezultatele din registrul xmm0 la adresele a : : [ a ] "m" ( * a ), [ b ] " m " ( * b ) : "%xmm0" , "%xmm1" );

Vezi și

Taxonomia lui Flynn
- SIMD
- SISD
- MIMD
- MISD

Link -uri

Manual oficial pentru procesoarele Intel, partea 2a O listă de instrucțiuni, inclusiv SSE, (AM în alfabet latin) este dată în Secțiunea 3.2.
Manual oficial pentru procesoarele Intel, partea 2b O listă de instrucțiuni, inclusiv SSE, (NZ în alfabet latin) este dată în secțiunea 4.2.

seturi de instrucțiuni procesor x86
Intel	MMX SSE SSE2 SSE3 SSSE3 SSE4 ( SSE4.1 SSE4.2 ATA ) AES AVX FMA Intel MPX
AMD	3DNacum! SSE4a SSE5 AVX FMA AES xop
Cyrix	MMXEXT