MPEG-1 Audio Layer II

MPEG-1/MPEG-2 Audio Layer 2
Extensie	.mp2
tip MIME	audio/mpeg, video/mpeg
Dezvoltator	ISO , IEC
Tip de format	audio, video, container
Extins din	MUSICAM
Dezvoltat în	MPEG-2
Standard(e)	ISO/IEC 11172-3 [1] , ISO/IEC 13818-3 [2]

MPEG-1 Audio Layer II (abreviat MP2 , uneori numit Musicam ) este unul dintre cele trei formate de compresie audio cu pierderi (nivelul 2) definite în standardul MPEG-1 [3] . Folosit în radiodifuziunea digitală DAB și standardul moștenit Video CD care a fost folosit pentru a distribui filme pe CD optic în anii 1990 și a precedat utilizarea pe scară largă a DVD -ului .

Codificatorul MPEG-1 Audio Layer 2 a evoluat din codecul audio MUSICAM ( Masking pattern adapted Universal Subband Integrated Coding And Multiplexing ) dezvoltat de CCETT , Philips și IRT în 1989, ca parte a studiilor europene EUREKA 147. dezvoltări interguvernamentale pentru sistemele de difuzare digitală pentru receptoare fixe, portabile și mobile (fondate în 1987). Principalii parametri ai MPEG-1 Audio au fost moșteniți de la MUSICAM, inclusiv banca de filtre, procesarea domeniului de timp, dimensiunea cadrului audio etc. Cu toate acestea, după îmbunătățiri suplimentare, algoritmul MUSICAM nu a fost utilizat în versiunea finală a stratului MPEG-1. II standard [4] .

Parametrii de bază

MPEG-1 Audio Layer II este definit în ISO/IEC 11172-3 (MPEG-1 Partea 3)
- Frecvența de eșantionare: 32, 44,1 și 48 kHz
- Rate de biți: 32, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320 și 384 kbps.
Extensia de format a fost introdusă în MPEG-2 Audio Layer II și definită în ISO/IEC 13818-3 (MPEG-2 Part 3) [5] [6]
- rate de eșantionare suplimentare: 16, 22,05 și 24 kHz
- rate de biți suplimentare: 8, 16, 24, 40 și 144 kbps, pentru formatul 5.1 - aproximativ 1 Mbps.
- suport multicanal - până la 5 canale complete și un canal de efecte de joasă frecvență.
Rată de biți variabilă (VBR) acceptată

Codificare și decodare audio MPEG-1 Layer II

Metoda de codificare

Semnalul audio digital de intrare este împărțit în cadre (cadre), fiecare dintre acestea fiind codificat și decodat independent de celelalte cadre. Dimensiunea cadrului pentru Stratul II este de 1152 de mostre.

Banda de semnal audio este împărțită în 32 de sub-benzi folosind filtre digitale de trecere a benzii. Toate sub-benzile au aceeași lățime, care depinde de rata de eșantionare a semnalului de intrare. După împărțire, frecvența de eșantionare este redusă cu un factor de 32, astfel încât numărul de eșantioane per cadru în fiecare subbandă este 36.

Apoi datele sunt cuantificate. Factorii de scară sunt determinați preliminar, care depind de valoarea maximă a semnalului. În acest caz, factorul de scară este determinat pentru grupuri de 12 citiri în fiecare subdomeniu, iar factorul poate fi comun pentru două sau trei grupuri. Astfel, se determină până la trei factori de scară pentru fiecare subbandă dintr-un cadru. Înainte de cuantificare, valorile semnalului sunt împărțite la factorii de scară corespunzători.

Apoi, cuantizarea datelor este efectuată în blocul de cuantizare și codare. Comprimarea informațiilor audio la nivelul Layer II se bazează pe o metodă numită alocare adaptivă de biți. Această metodă constă în efectuarea cuantizării cu un număr diferit de biți de cuantizare pentru diferite sub-benzi de frecvență. În acest caz, se utilizează cuantificare uniformă. Numărul total de biți alocați tuturor sub-benzilor dintr-un cadru dat depinde de rata de eșantionare a semnalului de intrare și de rata de biți de ieșire dată, adică de gradul necesar de compresie a informațiilor audio. Distribuția biților pe sub-benzi este realizată de blocul model psihoacustic .

După cuantizare, datele primite sunt codificate. Eșantioanele de semnal cuantificate din fiecare subbandă sunt combinate cu trei, iar secvențele de biți rezultate sunt codificate folosind tabele de coduri cu lungime variabilă. În plus, datele despre distribuția biților pe sub-benzi și datele despre factorii de scalare sunt codificate folosind tabelele corespunzătoare.

Pentru a efectua distribuția biților în blocul model psihoacustic, se analizează spectrul semnalului audio original (nedescompus în sub-benzi). Pentru a face acest lucru, se efectuează o transformare Fourier rapidă a secțiunilor acestui semnal pentru 1024 de numărări, după care se calculează spectrul de putere al semnalului sonor și mărimea presiunii sonore în fiecare subbandă de frecvență.

Apoi, componentele tonale (sinusoidale) și non-tonale ale semnalului audio sunt analizate, se determină pragurile de mascare locale și globale și se calculează rapoartele semnal/mască pentru toate sub-benzile, pe baza cărora biții sunt alocați sub-benzilor.

În acele sub-benzi în care distorsiunea audio cauzată de cuantizare este mai puțin vizibilă pentru ascultător sau este mascată de un nivel de semnal mai mare în alte sub-benzi, cuantizarea este mai grosieră, adică sunt alocați mai puțini biți pentru aceste sub-benzi. Pentru sub-benzi complet mascate, nu sunt alocați deloc biți. Datorită acestui fapt, este posibil să se reducă semnificativ cantitatea de informații transmise, menținând în același timp o calitate suficient de ridicată a sunetului.

Decodare

Datele conținute în cadru sunt decodificate în conformitate cu ordinea lor și cu tabelele de coduri conținute în programul de lucru al decodorului. Distribuția biților decodați și datele factorului de scară sunt utilizate pentru a decoda și decuantifica datele audio. După decuantizare, eșantioanele semnalelor de sub-bandă sunt înmulțite cu factorii de scară corespunzători.

După decodare și decuantizare, eșantioanele de semnal ale tuturor sub-benzilor sunt combinate într-un semnal audio digital de ieșire.

Note

↑ ISO/IEC 11172-3:1993 - Tehnologia informației -- Codarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s -- Partea 3: Audio (downlink) . ISO (1993). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ ISO/IEC 13818-3:1995 - Tehnologia informației - Codarea generică a imaginilor în mișcare și a informațiilor audio asociate - Partea 3: Audio (downlink) . ISO (1995). Preluat la 15 martie 2011. Arhivat din original la 23 martie 2012. (nedefinit)
↑ ISO/IEC 11172-3:1993 Tehnologia informației — Codarea imaginilor în mișcare și a sunetului asociat pentru medii de stocare digitale de până la aproximativ 1,5 Mbit/s — Partea 3: Audio . Consultat la 14 martie 2011. Arhivat din original pe 23 martie 2012. (nedefinit)
↑ Fapte despre compresia MPEG Arhivat 8 mai 2001.
↑ MPEG-2 Audio Layer I/II . Consultat la 14 martie 2011. Arhivat din original la 30 aprilie 2010. (nedefinit)
↑ Antet cadru audio MPEG Arhivat 8 februarie 2015.

Literatură

Smirnov A.V. Fundamentele televiziunii digitale: Manual.- M .: Hotline-Telecom, 2001. - 224 p.: ill.

Link -uri

Compresia audio digitală: baze și algoritmi psihoacustici. Yuri Kovalgin

Vezi și

MPEG-1
- MPEG-1 Audio Layer I
- MPEG-1 Layer III (MP3)
MPEG-2
- AAC (MPEG-2 Part 7) - actualizat în 1999 și inclus în MPEG-4 Part 3
MPEG-4
- AAC (MPEG-4 partea 3)

MPEG (Moving Picture Experts Group)
MPEG-1 2 3 patru 7 21 A B C D E V M U
Secțiuni MPEG-1	Partea 3: Audio ( Layer I Stratul II stratul III )
Secțiuni MPEG-2	Partea 1: Sisteme ( fluxul de trafic fluxul programului ) Partea 2: Video (H.262) Partea 3: Audio ( Layer I Stratul II Stratul III MPEG multicanal ) Partea 6: DSM CC Partea 7: AAC
Secțiuni MPEG-4	Partea 2: Video Partea 3: HE-AAC Partea 6: DMIF Partea 10: H.264 Partea 11: Descrierea scenei Partea 12: Formatul fișierului media ISO Partea 14: Format de fișier MP4 Partea 17: Format text de redare în flux Partea 20: Aplicație ușoară de redare a scenei (LASer)
Secțiuni MPEG-7	Partea 2: Limbajul de descriere a definiției (DDL)
Secțiuni MPEG-21	Părțile 2, 3 și 9: Obiect digital Partea 5: Limbajul de descriere a drepturilor (REL)
Secțiuni MPEG-D	Partea 1: Audio spațial MPEG

Compresie audio
Codec-uri	ATRAC Dolby Digital /AC3 DTS Musepack Opus TwinVQ (VQF) Vorbis WMA
Vorbire/voce	AMBE iLBC IMBE iSAC Nellymoser QCELP RTAudio MĂTASE Sirenă Speex SVOPC Vorbirea adevărată
Fara pierderi	Pierderea merelor FLAC La Audio de maimuță OptimFROG TAK True Audio/ TTA pachet wav WMA fără pierderi
Standarde și formate	AAC AMR G. 711 718 719 722 723 723,1 726 728 729 729,1 729A HE-AAC MLP Audio MPEG-1 Stratul I Stratul II Stratul III MT9 RealMedia SHN
Formate audio digitale Comparația formatelor audio digitale

containere media
Video/Audio	3gp ASF AVI Bink DMF DPX EVO FLV MP4 MPEG MPEG-PS MPEG-TS MXF Matroska (MKV) Ogg Media Ogg Timp rapid RIFF RealMedia Smacker VOB WebM WMV comprimare comparaţie
Audio	AIFF MAIMUŢĂ A.U. DSD DXD FLAC MLP MP3 SHN WAV WMA comprimare comparaţie
Muzică	MIDI ( KAR ) muzică de urmărire
Raster	DNG FPX FLIF HEIF ICER ICO ILBM JBIG2 JBIG JPEG XR (foto HD) JPEG / JP2 / JPEG-LS MNG EXR PCX PNG PSD PNM Brut TIFF TGA WBMP WebP XCF PGF Animat: APNG , GIF Fără pierderi: BMP Inclusiv compresie cu pierderi: BPG
Vector	SWF AI CDR EPS PS SVG VRML EMF WMF X3D XPS 3D: 3DS Animat: SVG
Complex	CGM DjVu PDF