MPEG-1 Audio Layer I

MPEG-1 Audio Layer 1
Extensie .mp1sau.m1a
tip MIME audio/mpeg [1] , audio/MPA [2]
Dezvoltator ISO , IEC
Tip de format audio
Standard(e) ISO/IEC 11172-3 [3] ,
ISO/IEC 13818-3 [4]
Site-ul web mpeg.chiariglione.org

MPEG-1 Audio Layer I (abrev. MP1 ) este unul dintre cele trei formate de compresie audio cu pierderi (nivel 1) definite în standardul MPEG-1 [5] . În timp ce MPEG-1 Audio Layer I este acceptat de majoritatea playerelor media moderne , formatul este considerat învechit. În schimb, formatele MP2 și MP3 sunt utilizate în principal .

Fișierele care conțin doar informații audio MP1 folosesc extensia .mp1 sau uneori .m1a.

Tehnologia de compresie MP1 folosește o schemă de codificare a benzilor relativ simplă cu 32 de sub-benzi.

Layer I (Layer 1) este recomandat pentru utilizare profesională în sisteme de înregistrare/reînregistrare de înaltă calitate de studio cu capacitate de memorie suficientă. Se caracterizează printr-o complexitate scăzută și un grad scăzut de reducere a datelor audio.

Stratul MPEG-1 I a fost folosit și în caseta digitală compactă ca parte a codec-ului audio PASC ( Precision Adaptive Sub-band Coding  ) .  Datorită necesității de a transfera un flux constant de blocuri de date individuale (cadre) pe bandă, PASC a folosit un bit suplimentar în antetul MPEG pentru a determina începutul unui cadru. Rata de biți este întotdeauna 384 kbps [6] .

Parametrii de bază

Codificare și decodare audio MPEG-1 Layer I

Metoda de codificare

Semnalul audio digital de intrare este împărțit în cadre (cadre), fiecare dintre acestea fiind codificat și decodat independent de celelalte cadre. Dimensiunea cadrului pentru Stratul I este de 384 de mostre.

Banda de semnal audio este împărțită în 32 de sub-benzi folosind filtre digitale de trecere a benzii. Toate sub-benzile au aceeași lățime, care depinde de rata de eșantionare a semnalului de intrare. După împărțire, rata de eșantionare este redusă cu un factor de 32, astfel încât numărul de eșantioane per cadru în fiecare subbandă este 12.

Apoi datele sunt cuantificate. Factorii de scară sunt determinați preliminar, care depind de valoarea maximă a semnalului. În acest caz, factorul de scară este determinat pentru fiecare sub-bandă din cadru, adică pentru 12 mostre ale semnalului sub-bandă. Înainte de cuantificare, valorile semnalului sunt împărțite la factorii de scară corespunzători.

Apoi, cuantizarea datelor este efectuată în blocul de cuantizare și codare. Comprimarea informațiilor audio la nivelul Layer I se bazează pe o metodă numită alocare adaptivă de biți. Această metodă constă în efectuarea cuantizării cu un număr diferit de biți de cuantizare pentru diferite sub-benzi de frecvență. În acest caz, se utilizează cuantificare uniformă. Numărul total de biți alocați tuturor sub-benzilor dintr-un cadru dat depinde de rata de eșantionare a semnalului de intrare și de rata de biți de ieșire dată, adică de gradul necesar de compresie a informațiilor audio. Distribuția biților pe sub-benzi este realizată de blocul model psihoacustic .

Pentru a efectua distribuția de biți în blocul model psihoacustic, este analizat spectrul semnalului audio original (nedescompus în sub-benzi). Pentru a face acest lucru, se efectuează o transformare Fourier rapidă a secțiunilor acestui semnal în 512 eșantioane, după care se calculează spectrul de putere a semnalului sonor și mărimea presiunii sonore în fiecare subbandă de frecvență.

Apoi, componentele tonale (sinusoidale) și non-tonale ale semnalului audio sunt analizate, se determină pragurile de mascare locale și globale și se calculează rapoartele semnal/mască pentru toate sub-benzile, pe baza cărora biții sunt alocați sub-benzilor.

În acele sub-benzi în care distorsiunea audio cauzată de cuantizare este mai puțin vizibilă pentru ascultător sau este mascată de un nivel de semnal mai mare în alte sub-benzi, cuantizarea este mai grosieră, adică sunt alocați mai puțini biți pentru aceste sub-benzi. Pentru sub-benzi complet mascate, nu sunt alocați deloc biți. Datorită acestui fapt, este posibil să se reducă semnificativ cantitatea de informații transmise, menținând în același timp o calitate suficient de ridicată a sunetului.

Decodare

Datele conținute în cadru sunt decodificate în conformitate cu ordinea lor și cu tabelele de coduri conținute în programul de lucru al decodorului. Distribuția biților decodați și datele factorului de scară sunt utilizate pentru a decoda și decuantifica datele audio. După decuantizare, eșantioanele semnalelor de sub-bandă sunt înmulțite cu factorii de scară corespunzători.

După decodare și decuantizare, eșantioanele de semnal ale tuturor sub-benzilor sunt combinate într-un semnal audio digital de ieșire.

Literatură

Link -uri

Compresia audio digitală: baze și algoritmi psihoacustici. Yuri Kovalgin

Vezi și

Note

  1. Tipul media audio/mpeg - RFC 3003 (downlink) . IETF (noiembrie 2000). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. 
  2. MIME Type Registration of RTP Payload Formats - RFC 3555 (link nu este disponibil) . IETF (iulie 2003). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. 
  3. ISO/IEC 11172-3:1993 - Tehnologia informației -- Codarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s -- Partea 3: Audio (downlink) . ISO (1993). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. 
  4. 1 2 ISO/IEC 13818-3:1995 - Tehnologia informației - Codarea generică a imaginilor în mișcare și a informațiilor audio asociate - Partea 3: Audio (downlink) . ISO (1995). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. 
  5. ISO/IEC 11172-3 „Codificarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s. Partea 3 Audio»
  6. Casetă digitală compactă. întrebări frecvente
  7. Antet cadru audio MPEG Arhivat 8 februarie 2015.
  8. ISO/IEC 13818-3 (Ediția a doua 1998-04-15) . Preluat la 15 martie 2011. Arhivat din original la 8 august 2011.