MPEG-1/MPEG-2 Audio Layer 2 | |
---|---|
Extensie | .mp2 |
tip MIME | audio/mpeg, video/mpeg |
Dezvoltator | ISO , IEC |
Tip de format | audio, video, container |
Extins din | MUSICAM |
Dezvoltat în | MPEG-2 |
Standard(e) |
ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2] |
MPEG-1 Audio Layer II (abreviat MP2 , uneori numit Musicam ) este unul dintre cele trei formate de compresie audio cu pierderi (nivelul 2) definite în standardul MPEG-1 [3] . Folosit în radiodifuziunea digitală DAB și standardul moștenit Video CD care a fost folosit pentru a distribui filme pe CD optic în anii 1990 și a precedat utilizarea pe scară largă a DVD -ului .
Codificatorul MPEG-1 Audio Layer 2 a evoluat din codecul audio MUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) dezvoltat de CCETT , Philips și IRT în 1989, ca parte a studiilor europene EUREKA 147. dezvoltări interguvernamentale pentru sistemele de difuzare digitală pentru receptoare fixe, portabile și mobile (fondate în 1987). Principalii parametri ai MPEG-1 Audio au fost moșteniți de la MUSICAM, inclusiv banca de filtre, procesarea domeniului de timp, dimensiunea cadrului audio etc. Cu toate acestea, după îmbunătățiri suplimentare, algoritmul MUSICAM nu a fost utilizat în versiunea finală a stratului MPEG-1. II standard [4] .
Semnalul audio digital de intrare este împărțit în cadre (cadre), fiecare dintre acestea fiind codificat și decodat independent de celelalte cadre. Dimensiunea cadrului pentru Stratul II este de 1152 de mostre.
Banda de semnal audio este împărțită în 32 de sub-benzi folosind filtre digitale de trecere a benzii. Toate sub-benzile au aceeași lățime, care depinde de rata de eșantionare a semnalului de intrare. După împărțire, frecvența de eșantionare este redusă cu un factor de 32, astfel încât numărul de eșantioane per cadru în fiecare subbandă este 36.
Apoi datele sunt cuantificate. Factorii de scară sunt determinați preliminar, care depind de valoarea maximă a semnalului. În acest caz, factorul de scară este determinat pentru grupuri de 12 citiri în fiecare subdomeniu, iar factorul poate fi comun pentru două sau trei grupuri. Astfel, se determină până la trei factori de scară pentru fiecare subbandă dintr-un cadru. Înainte de cuantificare, valorile semnalului sunt împărțite la factorii de scară corespunzători.
Apoi, cuantizarea datelor este efectuată în blocul de cuantizare și codare. Comprimarea informațiilor audio la nivelul Layer II se bazează pe o metodă numită alocare adaptivă de biți. Această metodă constă în efectuarea cuantizării cu un număr diferit de biți de cuantizare pentru diferite sub-benzi de frecvență. În acest caz, se utilizează cuantificare uniformă. Numărul total de biți alocați tuturor sub-benzilor dintr-un cadru dat depinde de rata de eșantionare a semnalului de intrare și de rata de biți de ieșire dată, adică de gradul necesar de compresie a informațiilor audio. Distribuția biților pe sub-benzi este realizată de blocul model psihoacustic .
După cuantizare, datele primite sunt codificate. Eșantioanele de semnal cuantificate din fiecare subbandă sunt combinate cu trei, iar secvențele de biți rezultate sunt codificate folosind tabele de coduri cu lungime variabilă. În plus, datele despre distribuția biților pe sub-benzi și datele despre factorii de scalare sunt codificate folosind tabelele corespunzătoare.
Pentru a efectua distribuția biților în blocul model psihoacustic, se analizează spectrul semnalului audio original (nedescompus în sub-benzi). Pentru a face acest lucru, se efectuează o transformare Fourier rapidă a secțiunilor acestui semnal pentru 1024 de numărări, după care se calculează spectrul de putere al semnalului sonor și mărimea presiunii sonore în fiecare subbandă de frecvență.
Apoi, componentele tonale (sinusoidale) și non-tonale ale semnalului audio sunt analizate, se determină pragurile de mascare locale și globale și se calculează rapoartele semnal/mască pentru toate sub-benzile, pe baza cărora biții sunt alocați sub-benzilor.
În acele sub-benzi în care distorsiunea audio cauzată de cuantizare este mai puțin vizibilă pentru ascultător sau este mascată de un nivel de semnal mai mare în alte sub-benzi, cuantizarea este mai grosieră, adică sunt alocați mai puțini biți pentru aceste sub-benzi. Pentru sub-benzi complet mascate, nu sunt alocați deloc biți. Datorită acestui fapt, este posibil să se reducă semnificativ cantitatea de informații transmise, menținând în același timp o calitate suficient de ridicată a sunetului.
Datele conținute în cadru sunt decodificate în conformitate cu ordinea lor și cu tabelele de coduri conținute în programul de lucru al decodorului. Distribuția biților decodați și datele factorului de scară sunt utilizate pentru a decoda și decuantifica datele audio. După decuantizare, eșantioanele semnalelor de sub-bandă sunt înmulțite cu factorii de scară corespunzători.
După decodare și decuantizare, eșantioanele de semnal ale tuturor sub-benzilor sunt combinate într-un semnal audio digital de ieșire.
Compresia audio digitală: baze și algoritmi psihoacustici. Yuri Kovalgin
MPEG (Moving Picture Experts Group) | |
---|---|
Secțiuni MPEG-1 |
|
Secțiuni MPEG-2 |
|
Secțiuni MPEG-4 |
|
Secțiuni MPEG-7 |
|
Secțiuni MPEG-21 |
|
Secțiuni MPEG-D |
|
Compresie audio | |
---|---|
Codec-uri | |
Vorbire/voce |
|
Fara pierderi |
|
Standarde și formate | |
containere media | |
---|---|
Video/Audio | |
Audio | |
Muzică | |
Raster | |
Vector | |
Complex |