VAD ( Detecția activității vocale în engleză ), precum și Suprimarea tăcerii (din engleză - „suprimarea tăcerii”) - detectarea activității vocii în semnalul acustic de intrare pentru a separa vorbirea activă de zgomotul de fundal sau tăcerea. O voce interpretată ca zgomot poate genera „tăieri” din conversație (chipping). Fundalul interpretat ca voce are ca rezultat o eficiență redusă a compresiei (de exemplu, în DTX ).
La digitizarea vocii, fragmentele de semnal clasificate ca vorbire activă pot fi ulterior codificate și comprimate de orice codec audio (de exemplu, CELP ) atunci când sunt utilizate în software pentru a distinge între vocea umană și zgomotul de fundal în vorbirea codificată.
Utilizarea mecanismului VAD (sau suprimarea tăcerii) vă permite să economisiți transmisia de date pe un canal de comunicație , deoarece o întrerupere a vorbirii (determinată de nivelul semnalului) nu este digitalizată sau codificată și, astfel, pachetele „goale” cu tăcere nu sunt transmise. prin rețea. Acest lucru este foarte important pentru transmisia de pachete (care este transmisia în rețele TCP / IP), deoarece pe lângă datele în sine, fiecare protocol de toate nivelurile modelului OSI (transport, rețea etc.) adaugă propriile informații de serviciu la fiecare pachet de date. Ca rezultat, dimensiunea pachetului crește semnificativ. Astfel, excluderea pachetelor „goale” cu zgomot mic este o modalitate ușoară de a economisi traficul și, ca urmare, de a crește debitul canalului. Din acest motiv, mecanismul VAD este destul de des folosit împreună cu diverse codecuri pentru compresie eficientă în telefonia IP .
Problema cu VAD este că, ca urmare a suprimării tăcerii (de fapt, sunet de nivel scăzut), ascultătorul nu aude deloc semnale de identificare (respirație, adulmecare și alte zgomote mici care însoțesc vorbirea live). Acest lucru creează unele probleme, deoarece în vorbirea colocvială obișnuită se aude totul. Absența zgomotului obișnuit în timpul reproducerii vocii provoacă disconfort și reduce nivelul de percepție și înțelegere.
Pentru a rezolva această problemă, pe partea celui de-al doilea abonat (sau ascultător), poate fi utilizată emularea sunetelor însoțitoare, numită generare de zgomot de confort (CNG) (procesul invers pentru VAD).