Subeșantionarea culorilor

Subeșantionarea culorilor (de exemplu Chroma subsampling )  este o tehnologie de codificare a imaginii în care valorile de luminozitate sunt stocate pentru fiecare pixel, iar datele de culoare sunt stocate pentru grupuri de pixeli, astfel încât rata de eșantionare a semnalelor diferențelor de culoare poate fi mai mică decât rata de eșantionare. a semnalului de luminozitate. Bazat pe particularitatea vederii umane , exprimată printr-o sensibilitate mai mare la schimbările de luminozitate decât culoarea. Subeșantionarea culorilor este o modalitate importantă de a reduce dimensiunea unui flux de date video digitale ( compresie video digitală). Folosit în sistemele de televiziune analogică și digitală , înregistrări video digitale și algoritmi de compresie a imaginii, cum ar fi JPEG .

În practică, codarea imaginii se realizează prin reducerea rezoluției în canalele de diferență de culoare, menținând în același timp rezoluția în canalul de luminanță .

Istorie

Metoda a fost dezvoltată pentru prima dată în anii 1950 de Alda Bedford pentru sistemul de televiziune color RCA . Mai târziu a fost dezvoltat în standardul NTSC . Cu toate acestea, principiul separării informațiilor despre luminozitate și culoare a fost inventat chiar mai devreme - în 1938 de Georges Valensi .

Introducere

Pentru compatibilitatea cu un semnal de televiziune alb-negru și pentru posibilitatea de a reduce lățimea de bandă necesară pentru transmiterea informațiilor color, televiziunea color utilizează scheme speciale de însumare pentru cele trei componente ale semnalului video Y' - înseamnă luminozitate, și RY' și BY' - așa-numitele semnale de diferență de culoare. Pentru a digitiza un semnal video component în conformitate cu recomandările ITU-R 601, codarea este utilizată conform următoarelor formule:

La transmiterea unor astfel de semnale, este posibilă restabilirea componentelor de culoare originale: roșu (R), albastru (B) și verde (G), care sunt utilizate în majoritatea sistemelor de afișare a informațiilor video.

Atunci când componentele diferențelor de culoare de reprezentare a semnalului video Y’, Cr, Cb Cr, Cb sunt transmise cu o rezoluție spațială, de două ori mai mică decât rezoluția semnalului de luminanță, în timp ce rata de eșantionare pentru semnalul de luminanță Y’ este setată la 13,5 MHz, care este de două ori mai mare decât pentru semnalele de diferență de culoare Cr și Cb - 6,75 MHz. Pentru standardele digitale, rata de eșantionare de bază este de 3,375 MHz, astfel încât ratele de eșantionare ale semnalelor de luminanță și două diferențe de culoare vor fi în raportul 4:2:2.

Pentru semnalele HDTV , în conformitate cu Partea II a Recomandării ITU-R 709-3, ratele de eșantionare pentru semnalele de luminanță sunt 74,25 MHz și crominanța 37,125 MHz.

Formate de subeșantionare

Structura de eșantionare a unui semnal este denumită raportul dintre cele trei părți X:a:b (de exemplu 4:2:2) care descrie numărul de mostre de semnale de luminanță și diferență de culoare. Uneori este de asemenea folosită o notație din patru părți (4:2:2:4), unde a patra cifră, dacă este inclusă, trebuie să fie identică cu prima cifră, indicând prezența unui semnal al patrulea canal care conține informații de transparență (canal alfa) . Aceste părți sunt:

4:1:1       4:2:0       4:2:2       4:4:4
Y'CrCb                                
                               
= = = =
tu                                                                
                               
+ + + +
unu 2 3 patru  X=4 unu 2 3 patru  X=4 unu 2 3 patru  X=4 unu 2 3 patru  X=4
(Cr, Cb) unu  a = 1 unu 2  a = 2 unu 2  a = 2 unu 2 3 patru  a = 4
unu  b = 1      b = 0 unu 2  b = 2 unu 2 3 patru  b = 4
¼ rezoluție orizontală, rezoluție
completă verticală
½ rezoluție orizontală,
½ rezoluție verticală
½ rezoluție orizontală, rezoluție
verticală completă
rezoluție orizontală completă,
rezoluție verticală completă

4:4:4

Fiecare dintre cele trei componente Y'CbCr are aceeași rată de eșantionare. Această schemă este uneori folosită în scanere scumpe și post -producție cinematografică . De obicei, interfața HD-SDI dual-link a standardului SMPTE 372M este utilizată pentru a oferi această lățime de bandă . Prima conexiune este pentru transmisia semnalului 4:2:2, a doua conexiune este pentru semnalul 0:2:2, 4:4:4 va fi transmisă în combinație.

Este de remarcat faptul că „4:4:4” poate fi înțeles ca spațiul de culoare R'G'B' , care nu are deloc subeșantionare de culoare. Formatele video precum HDCAM SR pot înregistra videoclipuri digitale 4:4:4 R'G'B' prin HD-SDI dual-link .

4:2:2

Folosit în cercetarea științifică, sistemele profesionale și formatul MPEG-2 . Recomandarea 601 definește un standard video digital compozit cu un raport de eșantionare între luminanță și diferență de culoare de 4:2:2. În fiecare linie, se transmite semnalul de luminanță completă, iar pentru semnalele de diferență de culoare, se face o probă la fiecare a doua probă. Astfel, rezoluția orizontală a culorii este redusă la jumătate.

4:2:1

Acest mod este definit și tehnic. Folosit într-un set limitat de codificatoare hardware și software.

4:1:1

Într-un raport de 4:1:1, rezoluția orizontală a semnalelor de diferență de culoare este redusă la un sfert din rezoluția completă a semnalului de luminanță, iar lățimea de bandă este îngustată (lățime de bandă crescută) cu un factor de doi în comparație cu modul de subeșantionare. 4:1:1 a fost folosit inițial în DV , care nu a fost considerat difuzat și a fost singurul format de înregistrare video acceptabil pentru aplicații cu buget redus și pentru consumatori. În prezent, formatul DV (cu eșantionare 4:1:1) este utilizat profesional pentru producția de știri și redarea video prin servere.

Într-un sistem NTSC, dacă rata de eșantionare a luminanței este de 13,5 MHz, atunci aceasta înseamnă că fiecare dintre semnalele Cr și Cb va fi eșantionat la 3,375 MHz, ceea ce corespunde unei lățimi de bandă Nyquist maximă de 1,6875 MHz, în timp ce tradiționalul „NTSC High- End Analog Broadcast Encoder va avea o frecvență Nyquist de 1,5 MHz și 0,5 MHz pentru canalele I/Q. Cu toate acestea, în majoritatea echipamentelor, în special televizoarele low cost și VHS/Betamax VCR, canalele color au o lățime de bandă de numai 0,5 MHz pentru Cr și Cb (echivalent pentru I/Q). Astfel, sistemul oferă de fapt o lățime de bandă color crescută față de cele mai bune specificații analogice compozite pentru NTSC, în ciuda faptului că folosește doar 1/4 din lățimea de bandă colorată a semnalului digital „complet”. Formatele care utilizează 4:1:1 includ:

4:2:0

Diferite configurații 4:2:0 pot fi găsite în:

Pentru componentele diferențelor de culoare Cb și Cr, fiecare probă a doua este aruncată în timpul prelevării, atât pe orizontală, cât și pe verticală. Există trei variante de scheme 4:2:0, care au diferite poziții orizontale și verticale ale citirilor:

Acest tip de procesare a datelor este deosebit de potrivit pentru sistemele de culoare PAL și SECAM. Majoritatea formatelor video digitale PAL folosesc, respectiv, 4:2:0, cu excepția DVCPRO25 care utilizează 4:1:1. Ambele opțiuni 4:1:1 și 4:2:0 reduc cerințele de lățime de bandă la jumătate în comparație cu reprezentarea fără eșantionare.

4:1:0

Sprijinit de unele codecuri, dar nu este utilizat pe scară largă. Acest raport folosește jumătate din rezoluția de culoare verticală și un sfert din rezoluția de culoare orizontală și doar o opteme din lățimea de bandă a rezoluției maxime de culoare.

3:1:1

Folosit în formatul de înregistrare video de înaltă definiție Sony HDCAM (nu HDCAM SR) . În direcția orizontală, mostrele de luminanță sunt eșantionate la trei sferturi din rata de eșantionare full HD - 1440 de mostre pe linie față de 1920 în HDCAM SR. În direcția verticală, atât canalele de lumina cât și de crominanță sunt eșantionate complet HD (1080 de mostre).

Terminologie

Termenul Y'UV se referă la o schemă de codare analogică, în timp ce Y'CbCr se referă la scheme de codare digitală. Una dintre diferențele dintre ele este că setul de coeficienți ai componentelor cromatice U, V și Cb, Cr este diferit. Cu toate acestea, termenul YUV este adesea folosit greșit atunci când se referă la codificarea Y'CbCr. Prin urmare, expresii precum „4:2:2 YUV” se referă întotdeauna la „4:2:2 Y'CbCr” pentru că pur și simplu nu există așa ceva ca 4:x:x într-o codificare analogică, cum ar fi YUV.

De asemenea, termenul de luminozitate și simbolul Y sunt adesea folosiți în mod eronat, referindu-se la luminozitate, care este notat cu simbolul Y'. Rețineți că luminanța (Y') utilizată de inginerii video se abate de la luminanța (Y) în colorimetrie (așa cum este definită de CIE). Luminanța (în TV) este formată ca o sumă ponderată a componentelor RGB cu corecție gamma (tricolor). Luminanța este formată ca o sumă ponderată a componentelor RGB liniare (tricolore).

În practica CIE, simbolul Y este adesea folosit greșit pentru a reprezenta luminozitatea. În 1993, SMPTE a adoptat EG 28 Manualul inginerului clarifică doi termeni. Rețineți că caracterul ' (liniuță) este folosit pentru a indica corecția gamma.

În plus, conceptul de croma/croma în inginerii video este diferit de crominanța în colorimetrie. Croma/croma în practica ingineriei video este formată din componente neliniare ponderate în trei culori. Termenii „croma” și „saturație” sunt adesea folosiți interschimbabil pentru a se referi la crominanță.

Formate video

Următorul tabel prezintă caracteristicile majorității formatelor video și tipurile de subeșantionare cromatică utilizate, precum și alți parametri înrudiți, cum ar fi rata de biți și raportul de compresie.

Format Proprietar Reducerea eșantionării Adâncimea culorii Rata datelor
(Mbps)
Tip de compresie Rata compresiei Rezoluție (pixeli)
Televiziune cu definiție standard (SD)
DV / MiniDV Mai multe 4:2:0 (PAL)
4:1:1 (NTSC)
8 biți 25 PrEP 5:1 720×576(PAL)
720×480(NTSC)
DVCPRO 25 Panasonic 4:1:1 8 biți 25 PrEP 5:1 720×576(PAL)
720×480(NTSC)
DVCPRO 50 Panasonic 4:2:2 8 biți cincizeci PrEP 3.3:1 720×576(PAL)
720×480(NTSC)
DVCAM Sony 4:2:0 (PAL)
4:1:1 (NTSC)
8 biți 25 PrEP 5:1 720×576(PAL)
720×480(NTSC)
betacam digital Sony 4:2:2 10 biți 90 PrEP 2.3:1 720×576(PAL)
720×480(NTSC)
Betacam SX Sony 4:2:2 10 biți 18/170 MPEG-2 10:1 720×576(PAL)
720×480(NTSC)
MPEG IMX Sony 4:2:2 8 biți 30
40
50
MPEG-2 6:1
4:1
3.3:1
720×576(PAL)
720×480(NTSC)
XDCAM Sony 4:2:0/4:1:1
4:2:2
8 biți 30
40
50

MPEG-2 DCT
6:1
4:1
3.3:1
720×576(PAL)
720×480(NTSC)
Televiziune de înaltă definiție (HD)
DVCPRO 100 Panasonic 4:2:2 8 biți 100 PrEP 6,7:1 1440×1080
960×720
HDCAM Sony 3:1:1 8 biți 144 MPEG-4 4:1 1440×1080
HDCAM SR Sony 4:2:2
4:4:4
10 biți 440
880
MPEG-4 4,2:1
2,7:1
1920×1080
HDV Sony JVC Canon 4:2:0 8 biți 19/25 MPEG-2 18:1 1440x1080
1920x1080
1280x720
AVCHD Panasonic Sony 4:2:0 8 biți 18/24 H.264 /MPEG-4 1440x1080
1920x1080
1280x720
XDCAM HD Sony 4:2:0 8 biți 18/50 MPEG-2 1440×1080
1280×720

Vezi și

Literatură