MPEG-1 Audio Layer 3 | |
---|---|
Extensie | .mp3[unu] |
tip MIME | audio/mpeg [2] , audio/MPA [3] și audio/mpa-robust [4] |
Dezvoltator | Societatea Fraunhofer , Karlheinz Brandenburg , Heinz Gerhäuser [d] , Bernhard Grill [d] și Harald Popp [d] |
publicat | 1993 |
Tip de format | format audio |
Fișiere media la Wikimedia Commons |
MP3 (mai precis, engleză MPEG-1 / 2 / 2.5 Layer 3 ; dar nu MPEG-3 ) este un format de fișier dezvoltat de echipa MPEG pentru stocarea informațiilor audio . Formatul a fost licențiat , dar pe 23 aprilie 2017, toate brevetele au expirat și taxele de licență au încetat [5] .
MP3 este unul dintre cele mai comune și populare formate de codare audio digitală . Este utilizat pe scară largă în rețelele de partajare a fișierelor pentru descărcări evaluative de muzică . Formatul poate fi redat pe aproape toate sistemele de operare populare, pe majoritatea playerelor audio portabile și este, de asemenea, acceptat de toate modelele moderne de centre muzicale și DVD playere .
Formatul MP3 folosește un algoritm de compresie cu pierderi conceput pentru a reduce semnificativ cantitatea de date necesară pentru redarea unei înregistrări și pentru a oferi o calitate a reproducerii sunetului apropiată de cea originală (în opinia majorității ascultătorilor), dar cu o pierdere notabilă a calității atunci când este auzită. pe un sistem de sunet de calitate. Principiul compresiei este de a reduce acuratețea unor părți ale fluxului audio, care este practic imposibil de distins pentru audierea pe echipamentul omniprezent de reproducere a sunetului de joasă fidelitate (de exemplu, majoritatea dominantă a dispozitivelor portabile, plăci de sunet, aparate stereo, radio auto și alte echipamente nespeciale), precum și pentru persoanele în vârstă, din cauza modificărilor naturale legate de vârstă ale aparatului auditiv, dar în cele mai multe cazuri se disting clar pe echipamentele audio de înaltă fidelitate . Această metodă se numește codare perceptivă [6] . În același timp, în prima etapă, o diagramă de sunet este construită sub forma unei secvențe de intervale de timp scurte, apoi informațiile care nu sunt distinse de urechea umană sunt îndepărtate din ea, iar informațiile rămase sunt stocate într-un format compact. formă. Această abordare este similară cu metoda de compresie utilizată la comprimarea imaginilor în format JPEG . [ clarifica ] Crearea unui MP3 cu o rată medie de biți de 128 kbps are ca rezultat un fișier care are aproximativ 1/11 din dimensiunea fișierului CD-Audio original ( formatul CD-Audio necomprimat în sine are o rată de biți de 1411,2 kbps). Fișierele MP3 pot fi create la un bitrate ridicat sau scăzut, ceea ce afectează calitatea fișierului rezultat.
MP3 a fost dezvoltat de un grup de lucru al Institutului Fraunhofer ( germană: Fraunhofer-Institut für Integrierte Schaltungen ) condus de Karlheinz Brandenburg și Universitatea din Erlangen-Nürnberg în colaborare cu AT&T Bell Labs și Thomson (Johnson, Stoll, Deeri etc.) .
Dezvoltarea MP3 sa bazat pe codecul experimental ASPEC (Adaptive Spectral Perceptual Entropy Coding). Primul codificator MP3 a fost L3Enc , lansat în vara anului 1994. Un an mai târziu, a apărut primul player MP3 software - Winplay3 .
La dezvoltarea algoritmului, au fost efectuate teste pe compoziții populare destul de specifice. „ Tom’s Diner ” a lui Suzanne Vega a devenit melodia principală . De aici și gluma că „MP3-ul a fost creat doar pentru ascultarea confortabilă a cântecului preferat al lui Brandenburg”, iar Vega a început să fie numită „mama MP3-ului”.
Un standard aproape complet a apărut în domeniul public pe 6 decembrie 1991 .
Pe 23 aprilie 2017, ultimele brevete pentru format au expirat și plățile de redevențe de la furnizorii de software și încorporați au fost oprite [7] [8] . Institutul Fraunhofer a anunțat încetarea acordării de licență a formatului pe site-ul său oficial [9] . Și, deși formatul mp3 este încă foarte popular în rândul utilizatorilor, majoritatea posturilor de radio și canalelor TV au trecut la utilizarea codec-urilor moderne care oferă o compresie mai bună și o pierdere mai mică a calității sunetului.
La fel ca formatul JPEG , MP3 folosește decuparea spectrală, conform modelului psihoacustic . Semnalul audio este împărțit în segmente de durată egală, fiecare dintre acestea, după procesare, este împachetat în propriul cadru (cadru). Descompunerea într-un spectru necesită continuitatea semnalului de intrare, prin urmare, cadrele precedente și următoare sunt folosite și pentru calcule. În semnalul audio, există armonici cu o amplitudine mai mică și armonici care se află în apropierea celor mai intense - astfel de armonici sunt întrerupte, deoarece urechea umană medie nu poate determina întotdeauna prezența sau absența unor astfel de armonici. Această caracteristică a auzului se numește efect de mascare . De asemenea, este posibil să înlocuiți două sau mai multe vârfuri din apropiere cu una medie (care, de regulă, duce la distorsiunea sunetului). Criteriul de limită este determinat de cerința fluxului de ieșire. Deoarece întregul spectru este relevant, armonicile de înaltă frecvență nu sunt tăiate, ca în JPEG , ci sunt eliminate doar selectiv pentru a reduce fluxul de informații din cauza rarefării spectrului. După „măturarea” spectrală, sunt aplicate metode matematice de compresie și împachetare în cadre. Fiecare cadru poate avea mai multe containere, ceea ce vă permite să stocați informații despre mai multe fluxuri (canal stâng și drept sau canal central și diferență de canal). Raportul de compresie poate fi variat, inclusiv în cadrul unui cadru. Intervalul valorilor posibile ale ratei de biți este de 8-320 kbit/s .
În trecut, se credea că înregistrarea la 128 kbps era potrivită pentru muzica destinată ascultării majorității oamenilor, oferind calitatea sunetului audio-CD . În realitate, totul este mult mai complicat. În primul rând, calitatea MP3-ului rezultat depinde nu numai de rata de biți, ci și de programul de codificare ( codec ) (standardul nu specifică algoritmul de codificare, descrie doar metoda de prezentare). În al doilea rând, pe lângă modul CBR (Constant Bitrate) predominant (în care, cu alte cuvinte, fiecare secundă de audio este codificată cu același număr de biți), există modurile ABR (Average Bitrate) și VBR (Variable Bitrate). În al treilea rând, limita de 128 kbps este arbitrară, deoarece a fost aleasă în epoca formării formatului, când calitatea redării majorității sistemelor digitale de sunet, de regulă, era mai mică decât în prezent. Aproximativ, afirmația despre „calitate Audio-CD” la 128 kbps corespunde limitei unei ascultări relativ confortabile a muzicii, sub care există o degradare puternică a sunetului în toate programele de codare MP3.
În 2008, fișierele MP3 cu o rată de biți de 192 kbps sunt cele mai comune, ceea ce poate indica indirect că majoritatea consideră că această rată de biți este suficientă. „Calitatea” reală percepută depinde de fișierul audio sursă, de ascultător și de sistemul lor audio. Unii iubitori de muzică preferă să comprima muzica la „calitate maximă” - 320 kbps sau chiar să treacă la codecuri fără pierderi, cum ar fi FLAC . Există, de asemenea, o opinie printre iubitorii de muzică / audiofili că unele mostre (fragmente ale unei înregistrări audio) nu sunt susceptibile de compresie cu pierderi de înaltă calitate: la toate ratele de biți posibile, nu este dificil să distingem audio comprimat de original. Cu toate acestea, există și obiecții serioase [10] :
Este destul de evident că (să o luăm cu o marjă) un bitrate de 256 kbps în marea majoritate a cazurilor ar trebui să fie mai mult decât suficient pentru o percepție confortabilă a muzicii de la o sursă CDA (44 kHz/16 biți/stereo). Acest lucru este evident nu numai din testul meu de acasă, ci și din analiza testelor profesionale oarbe (de exemplu, ediția germană a „c’t”, iunie 2000): chiar și în ele, experții nu sunt întotdeauna capabili să „ ghici" sunetul comprimat la 256 kbps, în plus, testarea are loc în camere special pregătite și pe echipamente scumpe, iar expertul știe ce să "asculte" pentru a simți compresia.
Există trei versiuni ale formatului MP3 pentru nevoi diferite: MPEG-1 , MPEG-2 și MPEG-2.5 . Ele diferă în intervalele posibile ale ratei de biți și ale ratei de eșantionare:
Deoarece formatul MP3 acceptă codare pe două canale (stereo), există 4 moduri:
CBR înseamnă Constant Bit Rate , adică o rată constantă de biți , care este setată de utilizator și nu se modifică atunci când lucrarea este codificată. Astfel, fiecare secundă a piesei corespunde aceluiași număr de biți de date codificați (chiar și atunci când se codifică tăcerea). CBR poate fi util pentru fluxuri media limitate de canal; într-un astfel de caz, codificarea utilizează toate capabilitățile canalului de date. Pentru stocare, acest mod de codare nu este optim, deoarece nu poate aloca suficient spațiu pentru segmente complexe ale produsului original, în timp ce pierde spațiu pe segmente simple. Ratele de biți mai mari (peste 256 kbps ) pot rezolva această problemă prin alocarea mai mult spațiu pentru date, dar și prin creșterea proporțională a dimensiunii fișierului.
VBR înseamnă Variable Bit Rate , adică o rată de biți variabilă sau o rată de biți variabilă , care este modificată dinamic de programul de codificare în timpul codificării, în funcție de saturația materialului audio codificat și de calitatea de codificare setată de utilizator (de exemplu , liniștea este codificată cu o rată de biți minimă). Această metodă de codare MP3 este cea mai progresivă și este încă în curs de dezvoltare și îmbunătățire, deoarece materialul audio cu saturație diferită poate fi codificat cu o anumită calitate, care este de obicei mai mare decât atunci când valoarea medie este setată în metoda CBR. În plus, dimensiunea fișierului este redusă datorită fragmentelor care nu necesită o rată de biți mare. Dezavantajul acestei metode de codare este dificultatea de a prezice dimensiunea fișierului de ieșire. Dar acest dezavantaj al codificării VBR este nesemnificativ în comparație cu avantajele sale. Un alt dezavantaj este că VBR consideră fragmentele mai silențioase ca fiind informații audio „nesemnificative”, așa că se dovedește că dacă asculți foarte tare, aceste fragmente vor fi de proastă calitate, în timp ce CBR realizează fragmente silențioase și puternice cu același bitrate.
Formatul VBR se îmbunătățește constant, datorită îmbunătățirii constante a modelului matematic de codec-uri, în special, după lansarea unei versiuni actualizate a codec-ului gratuit LAME MP3 (versiunea 3.99.3), codificare cu rată de biți variabilă, potrivit dezvoltatorilor. , este calitativ mai bun decât CBR și cu atât mai mult decât ABR. Cu toate acestea, formatul CBR 320 kbps este încă poziționat ca garantând calitate maximă (de exemplu, este folosit în presetarea „--preset insane”).
ABR înseamnă Average Bit Rate , adică rata medie de biți , care este un hibrid între VBR și CBR: rata de biți în kbps este setată de utilizator, iar programul o modifică, ajustând-o constant la rata de biți specificată. Astfel, codecul va folosi cu atenție valorile maxime și minime posibile ale ratei de biți, deoarece riscă să nu se încadreze în rata de biți specificată de utilizator. Acesta este un dezavantaj clar al acestei metode, deoarece afectează calitatea fișierului de ieșire, care va fi puțin mai bună decât atunci când utilizați CBR, dar mai rău decât atunci când utilizați VBR. Pe de altă parte, această metodă permite cea mai flexibilă setare a ratei de biți (poate fi orice număr între 8 și 320, față de doar multipli de 16 în metoda CBR) și calcularea dimensiunii fișierului de ieșire.
Tipuri de programe necesare pentru a converti formatele de fișiere. Cele mai comune codecuri MP3.
Un fișier MP3 este format din mai multe fragmente MP3 (cadre), care, la rândul lor, constau dintr-un antet și un bloc de date. O astfel de secvență de fragmente se numește flux elementar . Fragmentele nu sunt elemente independente (un „rezervor de octeți”) și, prin urmare, nu pot fi recuperate în mod arbitrar. Blocul de date al unui fișier MP3 conține informații audio comprimate sub formă de frecvențe și amplitudini. Diagrama de mai sus arată că un antet MP3 constă dintr-un marker care este utilizat pentru a găsi fragmentul MP3 corect. Acesta este urmat de un bit care indică faptul că este utilizat standardul MPEG și doi biți care indică faptul că este utilizat stratul 3; cu alte cuvinte, definește MPEG-1 Audio Layer 3 sau MP3. Următoarele valori pot varia în funcție de tipul fișierului MP3. Standardul ISO / IEC 11172-3 definește o gamă de valori pentru fiecare secțiune antet, împreună cu o specificație generală pentru aceasta. Majoritatea fișierelor MP3 conțin în prezent metadate ID3 care preced sau urmează segmentul MP3; sunt prezentate și în diagramă.
Etichete (din engleză etichetă - etichetă, etichetă, etichetă) - etichete în limitele unui fișier MP3 (la început și/sau la sfârșit). Acestea pot conține informații despre autor, album, anul lansării, coperta albumului și versurile și alte informații despre piesă. În versiunile ulterioare ale etichetelor, este posibil să stocați și alte date despre înregistrarea sunetului. Există diferite versiuni de etichete (vezi: ID3 ).
Deficiențe tehnice. Numărul de canale audio este limitat la două, spre deosebire de AAC și Vorbis . Există, de asemenea, o limită strictă a ratei de eșantionare posibile: nu există nicio modalitate de a seta o rată de eșantionare arbitrară. Rata maximă de eșantionare pentru MP3 este de 48 kHz în timp ce pentru Vorbis rata maximă de eșantionare este de 192 kHz, iar pentru AAC este de 96 kHz. În MP3, este posibil să salvați doar la următoarele rate de eșantionare: 8000, 11025, 12000, 16000, 22050, 24000, 32000, 44100 și 48000 Hz.
Restricții legale. Brevetul MP3 este deținut de Alcatel-Lucent , care necesita licențiere pentru unele utilizări ale formatului (brevetele legate de MP3 au expirat pe 23 aprilie 2017 ).
În SUA, invențiile au fost dezvăluite public de mai bine de un an[ când? ] , nu poate fi brevetat; cu toate acestea, pentru brevetele eliberate înainte de 8 iunie 1995 (aproape un standard complet a fost pus la dispoziția publicului pe 6 decembrie 1991), a fost posibilă prelungirea termenilor acestora. Brevetele cunoscute referitoare la decriptarea MP3 au expirat în SUA până în decembrie 2012; conform altor date, având în vedere doar brevetele depuse înainte de decembrie 1992, acest lucru nu s-a întâmplat în septembrie 2015 [ 12] [13] .
În 2017, toate brevetele aferente acestui format au expirat, nereînnoite de către deținătorii drepturilor de autor [5] .
Dicționare și enciclopedii | |
---|---|
În cataloagele bibliografice |
|
MPEG (Moving Picture Experts Group) | |
---|---|
Secțiuni MPEG-1 |
|
Secțiuni MPEG-2 |
|
Secțiuni MPEG-4 |
|
Secțiuni MPEG-7 |
|
Secțiuni MPEG-21 |
|
Secțiuni MPEG-D |
|
Compresie audio | |
---|---|
Codec-uri | |
Vorbire/voce |
|
Fara pierderi |
|
Standarde și formate | |
containere media | |
---|---|
Video/Audio | |
Audio | |
Muzică | |
Raster | |
Vector | |
Complex |