MPEG-1 Audio Layer 1 | |
---|---|
Extensie | .mp1sau.m1a |
tip MIME | audio/mpeg [1] , audio/MPA [2] |
Dezvoltator | ISO , IEC |
Tip de format | audio |
Standard(e) |
ISO/IEC 11172-3 [3] , ISO/IEC 13818-3 [4] |
Site-ul web | mpeg.chiariglione.org |
MPEG-1 Audio Layer I (abrev. MP1 ) este unul dintre cele trei formate de compresie audio cu pierderi (nivel 1) definite în standardul MPEG-1 [5] . În timp ce MPEG-1 Audio Layer I este acceptat de majoritatea playerelor media moderne , formatul este considerat învechit. În schimb, formatele MP2 și MP3 sunt utilizate în principal .
Fișierele care conțin doar informații audio MP1 folosesc extensia .mp1 sau uneori .m1a.
Tehnologia de compresie MP1 folosește o schemă de codificare a benzilor relativ simplă cu 32 de sub-benzi.
Layer I (Layer 1) este recomandat pentru utilizare profesională în sisteme de înregistrare/reînregistrare de înaltă calitate de studio cu capacitate de memorie suficientă. Se caracterizează printr-o complexitate scăzută și un grad scăzut de reducere a datelor audio.
Stratul MPEG-1 I a fost folosit și în caseta digitală compactă ca parte a codec-ului audio PASC ( Precision Adaptive Sub-band Coding ) . Datorită necesității de a transfera un flux constant de blocuri de date individuale (cadre) pe bandă, PASC a folosit un bit suplimentar în antetul MPEG pentru a determina începutul unui cadru. Rata de biți este întotdeauna 384 kbps [6] .
Semnalul audio digital de intrare este împărțit în cadre (cadre), fiecare dintre acestea fiind codificat și decodat independent de celelalte cadre. Dimensiunea cadrului pentru Stratul I este de 384 de mostre.
Banda de semnal audio este împărțită în 32 de sub-benzi folosind filtre digitale de trecere a benzii. Toate sub-benzile au aceeași lățime, care depinde de rata de eșantionare a semnalului de intrare. După împărțire, rata de eșantionare este redusă cu un factor de 32, astfel încât numărul de eșantioane per cadru în fiecare subbandă este 12.
Apoi datele sunt cuantificate. Factorii de scară sunt determinați preliminar, care depind de valoarea maximă a semnalului. În acest caz, factorul de scară este determinat pentru fiecare sub-bandă din cadru, adică pentru 12 mostre ale semnalului sub-bandă. Înainte de cuantificare, valorile semnalului sunt împărțite la factorii de scară corespunzători.
Apoi, cuantizarea datelor este efectuată în blocul de cuantizare și codare. Comprimarea informațiilor audio la nivelul Layer I se bazează pe o metodă numită alocare adaptivă de biți. Această metodă constă în efectuarea cuantizării cu un număr diferit de biți de cuantizare pentru diferite sub-benzi de frecvență. În acest caz, se utilizează cuantificare uniformă. Numărul total de biți alocați tuturor sub-benzilor dintr-un cadru dat depinde de rata de eșantionare a semnalului de intrare și de rata de biți de ieșire dată, adică de gradul necesar de compresie a informațiilor audio. Distribuția biților pe sub-benzi este realizată de blocul model psihoacustic .
Pentru a efectua distribuția de biți în blocul model psihoacustic, este analizat spectrul semnalului audio original (nedescompus în sub-benzi). Pentru a face acest lucru, se efectuează o transformare Fourier rapidă a secțiunilor acestui semnal în 512 eșantioane, după care se calculează spectrul de putere a semnalului sonor și mărimea presiunii sonore în fiecare subbandă de frecvență.
Apoi, componentele tonale (sinusoidale) și non-tonale ale semnalului audio sunt analizate, se determină pragurile de mascare locale și globale și se calculează rapoartele semnal/mască pentru toate sub-benzile, pe baza cărora biții sunt alocați sub-benzilor.
În acele sub-benzi în care distorsiunea audio cauzată de cuantizare este mai puțin vizibilă pentru ascultător sau este mascată de un nivel de semnal mai mare în alte sub-benzi, cuantizarea este mai grosieră, adică sunt alocați mai puțini biți pentru aceste sub-benzi. Pentru sub-benzi complet mascate, nu sunt alocați deloc biți. Datorită acestui fapt, este posibil să se reducă semnificativ cantitatea de informații transmise, menținând în același timp o calitate suficient de ridicată a sunetului.
Datele conținute în cadru sunt decodificate în conformitate cu ordinea lor și cu tabelele de coduri conținute în programul de lucru al decodorului. Distribuția biților decodați și datele factorului de scară sunt utilizate pentru a decoda și decuantifica datele audio. După decuantizare, eșantioanele semnalelor de sub-bandă sunt înmulțite cu factorii de scară corespunzători.
După decodare și decuantizare, eșantioanele de semnal ale tuturor sub-benzilor sunt combinate într-un semnal audio digital de ieșire.
Compresia audio digitală: baze și algoritmi psihoacustici. Yuri Kovalgin
MPEG (Moving Picture Experts Group) | |
---|---|
Secțiuni MPEG-1 |
|
Secțiuni MPEG-2 |
|
Secțiuni MPEG-4 |
|
Secțiuni MPEG-7 |
|
Secțiuni MPEG-21 |
|
Secțiuni MPEG-D |
|
Compresie audio | |
---|---|
Codec-uri | |
Vorbire/voce |
|
Fara pierderi |
|
Standarde și formate | |
containere media | |
---|---|
Video/Audio | |
Audio | |
Muzică | |
Raster | |
Vector | |
Complex |