MPEG-1 Audio Layer I

MPEG-1 Audio Layer 1
Extensie	.mp1sau.m1a
tip MIME	audio/mpeg [1] , audio/MPA [2]
Dezvoltator	ISO , IEC
Tip de format	audio
Standard(e)	ISO/IEC 11172-3 [3] , ISO/IEC 13818-3 [4]
Site-ul web	mpeg.chiariglione.org

MPEG-1 Audio Layer I (abrev. MP1 ) este unul dintre cele trei formate de compresie audio cu pierderi (nivel 1) definite în standardul MPEG-1 [5] . În timp ce MPEG-1 Audio Layer I este acceptat de majoritatea playerelor media moderne , formatul este considerat învechit. În schimb, formatele MP2 și MP3 sunt utilizate în principal .

Fișierele care conțin doar informații audio MP1 folosesc extensia .mp1 sau uneori .m1a.

Tehnologia de compresie MP1 folosește o schemă de codificare a benzilor relativ simplă cu 32 de sub-benzi.

Layer I (Layer 1) este recomandat pentru utilizare profesională în sisteme de înregistrare/reînregistrare de înaltă calitate de studio cu capacitate de memorie suficientă. Se caracterizează printr-o complexitate scăzută și un grad scăzut de reducere a datelor audio.

Stratul MPEG-1 I a fost folosit și în caseta digitală compactă ca parte a codec-ului audio PASC ( Precision Adaptive Sub-band Coding ) . Datorită necesității de a transfera un flux constant de blocuri de date individuale (cadre) pe bandă, PASC a folosit un bit suplimentar în antetul MPEG pentru a determina începutul unui cadru. Rata de biți este întotdeauna 384 kbps [6] .

Parametrii de bază

MPEG-1 Layer I este standardizat de ISO/IEC 11172-3, publicat pentru prima dată în 1993.
- Număr de canale: 1 sau 2.
- Rate de eșantionare: 32, 44,1 și 48 kHz.
- Rată de biți: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 și 448 kbps [7]
Extensia de format a fost introdusă în MPEG-2 Audio Layer I și definită în ISO/IEC 13818-3 (MPEG-2 Part 3) [8] , prima ediție a fost publicată în 1995 [4]
- rate de eșantionare suplimentare: 16, 22,05 și 24 kHz
- rate de biți suplimentare: 48, 56, 80, 112, 144 și 176 kbps.

Codificare și decodare audio MPEG-1 Layer I

Metoda de codificare

Semnalul audio digital de intrare este împărțit în cadre (cadre), fiecare dintre acestea fiind codificat și decodat independent de celelalte cadre. Dimensiunea cadrului pentru Stratul I este de 384 de mostre.

Banda de semnal audio este împărțită în 32 de sub-benzi folosind filtre digitale de trecere a benzii. Toate sub-benzile au aceeași lățime, care depinde de rata de eșantionare a semnalului de intrare. După împărțire, rata de eșantionare este redusă cu un factor de 32, astfel încât numărul de eșantioane per cadru în fiecare subbandă este 12.

Apoi datele sunt cuantificate. Factorii de scară sunt determinați preliminar, care depind de valoarea maximă a semnalului. În acest caz, factorul de scară este determinat pentru fiecare sub-bandă din cadru, adică pentru 12 mostre ale semnalului sub-bandă. Înainte de cuantificare, valorile semnalului sunt împărțite la factorii de scară corespunzători.

Apoi, cuantizarea datelor este efectuată în blocul de cuantizare și codare. Comprimarea informațiilor audio la nivelul Layer I se bazează pe o metodă numită alocare adaptivă de biți. Această metodă constă în efectuarea cuantizării cu un număr diferit de biți de cuantizare pentru diferite sub-benzi de frecvență. În acest caz, se utilizează cuantificare uniformă. Numărul total de biți alocați tuturor sub-benzilor dintr-un cadru dat depinde de rata de eșantionare a semnalului de intrare și de rata de biți de ieșire dată, adică de gradul necesar de compresie a informațiilor audio. Distribuția biților pe sub-benzi este realizată de blocul model psihoacustic .

Pentru a efectua distribuția de biți în blocul model psihoacustic, este analizat spectrul semnalului audio original (nedescompus în sub-benzi). Pentru a face acest lucru, se efectuează o transformare Fourier rapidă a secțiunilor acestui semnal în 512 eșantioane, după care se calculează spectrul de putere a semnalului sonor și mărimea presiunii sonore în fiecare subbandă de frecvență.

Apoi, componentele tonale (sinusoidale) și non-tonale ale semnalului audio sunt analizate, se determină pragurile de mascare locale și globale și se calculează rapoartele semnal/mască pentru toate sub-benzile, pe baza cărora biții sunt alocați sub-benzilor.

În acele sub-benzi în care distorsiunea audio cauzată de cuantizare este mai puțin vizibilă pentru ascultător sau este mascată de un nivel de semnal mai mare în alte sub-benzi, cuantizarea este mai grosieră, adică sunt alocați mai puțini biți pentru aceste sub-benzi. Pentru sub-benzi complet mascate, nu sunt alocați deloc biți. Datorită acestui fapt, este posibil să se reducă semnificativ cantitatea de informații transmise, menținând în același timp o calitate suficient de ridicată a sunetului.

Decodare

Datele conținute în cadru sunt decodificate în conformitate cu ordinea lor și cu tabelele de coduri conținute în programul de lucru al decodorului. Distribuția biților decodați și datele factorului de scară sunt utilizate pentru a decoda și decuantifica datele audio. După decuantizare, eșantioanele semnalelor de sub-bandă sunt înmulțite cu factorii de scară corespunzători.

După decodare și decuantizare, eșantioanele de semnal ale tuturor sub-benzilor sunt combinate într-un semnal audio digital de ieșire.

Literatură

Smirnov A.V. Fundamentele televiziunii digitale: Manual.- M .: Hotline-Telecom, 2001. - 224 p.: ill.

Link -uri

Compresia audio digitală: baze și algoritmi psihoacustici. Yuri Kovalgin

Vezi și

MPEG-1
- MPEG-1 Audio Layer II
- MPEG-1 Layer III (MP3)
MPEG-2
- AAC (MPEG-2 Part 7) - actualizat în 1999 și inclus în MPEG-4 Part 3
MPEG-4
- AAC (MPEG-4 partea 3)

Note

↑ Tipul media audio/mpeg - RFC 3003 (downlink) . IETF (noiembrie 2000). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ MIME Type Registration of RTP Payload Formats - RFC 3555 (link nu este disponibil) . IETF (iulie 2003). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ ISO/IEC 11172-3:1993 - Tehnologia informației -- Codarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s -- Partea 3: Audio (downlink) . ISO (1993). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ 1 2 ISO/IEC 13818-3:1995 - Tehnologia informației - Codarea generică a imaginilor în mișcare și a informațiilor audio asociate - Partea 3: Audio (downlink) . ISO (1995). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ ISO/IEC 11172-3 „Codificarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s. Partea 3 Audio»
↑ Casetă digitală compactă. întrebări frecvente
↑ Antet cadru audio MPEG Arhivat 8 februarie 2015.
↑ ISO/IEC 13818-3 (Ediția a doua 1998-04-15) . Preluat la 15 martie 2011. Arhivat din original la 8 august 2011. (nedefinit)

MPEG (Moving Picture Experts Group)
MPEG-1 2 3 patru 7 21 A B C D E V M U
Secțiuni MPEG-1	Partea 3: Audio ( Layer I Stratul II stratul III )
Secțiuni MPEG-2	Partea 1: Sisteme ( fluxul de trafic fluxul programului ) Partea 2: Video (H.262) Partea 3: Audio ( Layer I Stratul II Stratul III MPEG multicanal ) Partea 6: DSM CC Partea 7: AAC
Secțiuni MPEG-4	Partea 2: Video Partea 3: HE-AAC Partea 6: DMIF Partea 10: H.264 Partea 11: Descrierea scenei Partea 12: Formatul fișierului media ISO Partea 14: Format de fișier MP4 Partea 17: Format text de redare în flux Partea 20: Aplicație ușoară de redare a scenei (LASer)
Secțiuni MPEG-7	Partea 2: Limbajul de descriere a definiției (DDL)
Secțiuni MPEG-21	Părțile 2, 3 și 9: Obiect digital Partea 5: Limbajul de descriere a drepturilor (REL)
Secțiuni MPEG-D	Partea 1: Audio spațial MPEG

Compresie audio
Codec-uri	ATRAC Dolby Digital /AC3 DTS Musepack Opus TwinVQ (VQF) Vorbis WMA
Vorbire/voce	AMBE iLBC IMBE iSAC Nellymoser QCELP RTAudio MĂTASE Sirenă Speex SVOPC Vorbirea adevărată
Fara pierderi	Pierderea merelor FLAC La Audio de maimuță OptimFROG TAK True Audio/ TTA pachet wav WMA fără pierderi
Standarde și formate	AAC AMR G. 711 718 719 722 723 723,1 726 728 729 729,1 729A HE-AAC MLP Audio MPEG-1 Stratul I Stratul II Stratul III MT9 RealMedia SHN
Formate audio digitale Comparația formatelor audio digitale

containere media
Video/Audio	3gp ASF AVI Bink DMF DPX EVO FLV MP4 MPEG MPEG-PS MPEG-TS MXF Matroska (MKV) Ogg Media Ogg Timp rapid RIFF RealMedia Smacker VOB WebM WMV comprimare comparaţie
Audio	AIFF MAIMUŢĂ A.U. DSD DXD FLAC MLP MP3 SHN WAV WMA comprimare comparaţie
Muzică	MIDI ( KAR ) muzică de urmărire
Raster	DNG FPX FLIF HEIF ICER ICO ILBM JBIG2 JBIG JPEG XR (foto HD) JPEG / JP2 / JPEG-LS MNG EXR PCX PNG PSD PNM Brut TIFF TGA WBMP WebP XCF PGF Animat: APNG , GIF Fără pierderi: BMP Inclusiv compresie cu pierderi: BPG
Vector	SWF AI CDR EPS PS SVG VRML EMF WMF X3D XPS 3D: 3DS Animat: SVG
Complex	CGM DjVu PDF