Codificare audio

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 19 martie 2018; verificările necesită 30 de modificări .

În centrul codificării audio folosind un PC este procesul de conversie a vibrațiilor aerului în vibrații de curent electric și eșantionarea ulterioară a unui semnal electric analog . Codificarea și redarea informațiilor de sunet se realizează cu ajutorul unor programe speciale ( editor de sunet ). Calitatea redării sunetului codificat depinde de frecvența de eșantionare și de rezoluția acesteia (adâncimea de codificare a sunetului - numărul de niveluri)

Principiile digitalizării sunetului

Sunetul digital  este un semnal sonor analogic reprezentat de valori numerice discrete ale amplitudinii sale [1] .

Digitalizarea sunetului este o tehnologie de măsurare a amplitudinii unui semnal audio cu un anumit pas de timp și apoi înregistrarea valorilor obținute în formă numerică [1] . Un alt nume pentru digitizarea audio este conversia audio analog-digital.

Digitalizarea audio implică două procese:

Discretizarea timpului

Procesul de eșantionare în timp este procesul de obținere a valorilor semnalului care sunt convertite cu un anumit pas de timp - pasul de eșantionare . Numărul de măsurători ale mărimii semnalului, efectuate pe unitatea de timp, se numește rata de eșantionare sau rata de eșantionare sau frecvența de eșantionare (din engleză „sampling” - „sample”). Cu cât pasul de eșantionare este mai mic, cu atât frecvența de eșantionare este mai mare și cu atât vom obține o reprezentare mai precisă a semnalului.

Acest lucru este confirmat de teorema Kotelnikov (în literatura străină se găsește ca teorema Nyquist-Shannon). Potrivit acestuia, un semnal analogic cu un spectru limitat este descris cu acuratețe printr-o secvență discretă de valori ale amplitudinii sale, dacă aceste valori sunt luate la o frecvență care este de cel puțin două ori cea mai mare frecvență a spectrului de semnal. Adică, un semnal analogic care conține o frecvență de spectru egală cu F m poate fi reprezentat cu precizie printr-o succesiune de valori discrete de amplitudine dacă frecvența de eșantionare F d este: F d >2F m .

În practică, aceasta înseamnă că, pentru ca semnalul digitizat să conțină informații despre întreaga gamă de frecvențe audibile ale semnalului analogic original (20 Hz - 20 kHz), este necesar ca rata de eșantionare selectată să fie de cel puțin 40 kHz. Numărul de mostre de amplitudine pe secundă se numește rata de eșantionare (dacă rata de eșantionare este constantă).

Principala dificultate a digitizării este imposibilitatea înregistrării cu acuratețe perfectă a valorilor semnalului măsurat (deși acest lucru este posibil pe baza teoremei Shenon și Kotelnikov).

Cuantificare liniară (omogenă) a amplitudinii

Să alocăm N biți pentru înregistrarea unei valori a amplitudinii semnalului în memoria computerului. Aceasta înseamnă că cu ajutorul unui cuvânt de N biți pot fi descrise 2 N poziții diferite. Fie ca amplitudinea semnalului digitizat variază de la -1 la 1 a unor unități convenționale. Să reprezentăm acest interval de modificare a amplitudinii - intervalul dinamic al semnalului - sub forma a 2 N −1 intervale egale, împărțindu-l în 2 N niveluri - cuante. Acum, pentru a înregistra fiecare valoare individuală a amplitudinii, aceasta trebuie rotunjită la cel mai apropiat nivel de cuantizare. Acest proces se numește cuantizare de amplitudine. Cuantificarea amplitudinii este procesul de înlocuire a valorilor reale ale amplitudinii semnalului cu valori aproximate cu o oarecare precizie. Fiecare dintre cele 2 N niveluri posibile se numește nivel de cuantizare, iar distanța dintre cele mai apropiate două niveluri de cuantizare se numește pas de cuantizare. Dacă scara de amplitudine este împărțită în niveluri liniar, cuantizarea se numește liniară (omogenă).

Precizia rotunjirii depinde de numărul selectat (2 N ) de niveluri de cuantizare, care, la rândul său, depinde de numărul de biți (N) alocați pentru a înregistra valoarea amplitudinii. Numărul N se numește adâncimea de biți de cuantizare (adică numărul de cifre, adică de biți, din fiecare cuvânt), iar numerele obținute ca urmare a rotunjirii valorilor de amplitudine sunt mostre sau mostre (din engleză „ eșantion” - „măsurare”). Se presupune că erorile de cuantizare rezultate din cuantizarea pe 16 biți rămân aproape imperceptibile pentru ascultător.

Această metodă de digitizare a semnalului - eșantionarea semnalului în timp în conjuncție cu metoda de cuantizare omogenă - se numește modulare cod impuls (Ing. Pulse Code Modulation - PCM). Semnalul digitizat ca un set de valori succesive de amplitudine poate fi deja stocat în memoria computerului. În cazul în care sunt înregistrate valori absolute de amplitudine, acest format de înregistrare se numește PCM. Discul compact audio standard ( CD-DA ), utilizat de la începutul anilor 1980, stochează informații în format PCM cu o rată de eșantionare de 44,1 kHz și cuantizare pe 16 biți.

Alte moduri de digitizare

Convertoare analog-digitale (ADC)

Procesul de digitizare audio de mai sus este realizat de convertoare analog-digitale (ADC) . Această transformare include următoarele operații:

  1. Limitarea benzii se realizează folosind un filtru trece -jos pentru a suprima componentele spectrale a căror frecvență depășește jumătate din frecvența de eșantionare.
  2. Discretizarea în timp, adică înlocuirea unui semnal analogic continuu cu o secvență a valorilor sale în momente discrete de timp - mostre. Această problemă este rezolvată prin utilizarea unui circuit special la intrarea ADC - un dispozitiv de eșantionare și menținere .
  3. Cuantificarea nivelului este înlocuirea valorii eșantionului de semnal cu cea mai apropiată valoare dintr-un set de valori fixe - niveluri de cuantizare.
  4. Codificare sau digitizare, în urma căreia valoarea fiecărei probe cuantificate este reprezentată ca un număr corespunzător numărului ordinal al nivelului de cuantizare.

Acest lucru se face după cum urmează: un semnal analogic continuu este „taiat” în secțiuni, cu o frecvență de eșantionare, se obține un semnal digital discret, care trece prin procesul de cuantizare cu o anumită adâncime de biți, apoi este codificat, adică înlocuit. printr-o succesiune de simboluri de cod. Pentru a înregistra sunet în banda de frecvență de 20 Hz - 20 kHz, este necesară o frecvență de eșantionare de 44,1 kHz sau mai mare. Pentru a obține o înregistrare de înaltă calitate, o adâncime de biți de 16 biți este suficientă, totuși, pentru a extinde intervalul dinamic și a îmbunătăți calitatea înregistrării sunetului, se folosește o adâncime de biți de 24 și 32 de biți.

Codificarea sunetului digitizat înainte de a-l înregistra pe media

Există multe moduri diferite de a stoca sunetul digital. Sunetul digitizat este un set de valori ale amplitudinii semnalului luate la anumite intervale de timp.

Terminologie
  • codificator  - un program (sau dispozitiv) care implementează un algoritm specific de codificare a datelor (de exemplu, un arhivator sau un codificator MP 3), care acceptă informațiile sursă ca intrare și returnează informații codificate într-un format specific ca ieșire.
  • decodor  - un program (sau dispozitiv) care implementează transformarea inversă a unui semnal codificat într-unul decodat.
  • codecul  este o unitate software sau hardware concepută pentru a codifica/decodifica datele.
Unele formate de digitizare audio în comparație
Nume format Cuantizare, bit Frecvența de eșantionare, kHz Numărul de canale Flux de date pe disc, kbit/s Raport compresie/ambalare
CD 16 44.1 2 1411.2 1:1 fără pierderi
Dolby Digital (AC3) 16-24 48 6 până la 640 ~12:1 cu pierderi
DTS 20-24 48; 96 pana la 8 înainte de 1536 ~3:1 cu pierderi
DVD Audio 16; douăzeci; 24 44,1; 48; 88,2; 96 6 6912 2:1 fără pierderi
DVD Audio 16; douăzeci; 24 176,4; 192 2 4608 2:1 fără pierderi
MP3 plutitoare pana la 48 2 până la 320 ~11:1 cu pierdere
AAC plutitoare până la 96 pana la 48 până la 529 cu pierderi
AAC+ ( SBR ) plutitoare pana la 48 2 până la 320 cu pierderi
Ogg Vorbis pana la 32 până la 192 până la 255 până la 1000 cu pierderi
WMA pana la 24 până la 96 pana la 8 până la 768 2:1, există o versiune fără pierderi

Ciclu complet de conversie audio: de la digitizare la redarea consumatorilor

Corectarea zgomotului și codificarea canalelor

Codarea de corectare a zgomotului permite, în timpul redării semnalului, să identifice și să elimine (sau să reducă frecvența apariției acestora) erorile de citire din medii. Pentru a face acest lucru, atunci când scrieți la semnalul primit la ieșirea ADC, se adaugă redundanță artificială (bit de control), care ulterior ajută la restabilirea numărului deteriorat. Dispozitivele de înregistrare audio folosesc de obicei o combinație de două sau trei coduri de corectare a erorilor. Intercalarea este de asemenea aplicată pentru o mai bună protecție împotriva erorilor de explozie .

Codarea canalului este utilizată pentru a potrivi semnalele digitale cu parametrii canalului de transmisie (înregistrare/redare). Datele auxiliare sunt adăugate la semnalul util pentru a facilita decodificarea ulterioară. Acestea pot fi semnale de cod de timp , semnale de serviciu, semnale de sincronizare.

În dispozitivele de redare a semnalului digital, decodorul de canal extrage semnalele de ceas din fluxul de date general și convertește semnalul canalului de intrare într-un flux de date digitale. După corectarea erorilor, semnalul ajunge la DAC.

Principiul de funcționare al DAC

Semnalul digital primit de la decodor este convertit în analog. Această transformare are loc după cum urmează:

  1. Decodorul DAC convertește secvența de numere într-un semnal cuantificat discret
  2. Prin netezirea în domeniul timpului, un semnal continuu în timp este generat din eșantioane discrete
  3. Recuperarea finală a semnalului se face prin suprimarea spectrelor laterale într-un filtru analog trece-jos.

Parametri care afectează calitatea sunetului atunci când acesta trece prin ciclul complet

Principalii parametri care afectează calitatea sunetului în acest caz sunt:

De asemenea, sunt importanți parametrii căii analogice a dispozitivelor digitale de codificare și decodare:

Metode de codare

Există diverse metode de codificare a informațiilor audio cu un cod binar, printre care se numără două direcții principale: metoda FM și metoda Wave-Table.

Metoda FM (Frequency Modulation) se bazează pe faptul că teoretic orice sunet complex poate fi descompus într-o succesiune de semnale armonice simple de diferite frecvențe, fiecare dintre ele va fi o sinusoidă obișnuită, ceea ce înseamnă că poate fi descris printr-un cod. . Procesul de descompunere a semnalelor audio în serii armonice și reprezentarea lor sub formă de semnale digitale discrete are loc în dispozitive speciale numite „convertoare analog-digitale” (ADC).

Metoda wave-table (Wave-Table) se bazează pe faptul că mostre din sunete din lumea înconjurătoare, instrumente muzicale etc. sunt stocate în tabele pregătite în prealabil.Codurile numerice exprimă înălțimea, durata și intensitatea sunetului. , și alți parametri care caracterizează caracteristicile sunetului. Deoarece sunetele „reale” sunt folosite ca mostre, calitatea sunetului obținut în urma sintezei este foarte ridicată și se apropie de calitatea sunetului instrumentelor muzicale reale.

Note

  1. 1 2 Înțelegerea codificării audio . Preluat la 27 iunie 2011. Arhivat din original la 13 octombrie 2011.
  2. Sunetul: un pic de teorie . Consultat la 27 iunie 2011. Arhivat din original pe 28 iunie 2011.
  3. Sunet digital: pe primul loc . Consultat la 27 iunie 2011. Arhivat din original la 14 octombrie 2011.

Vezi și