Morphing (efect de sunet)

Morphing ( în engleză  morphing - transformare) - un efect sonor, care constă în impunerea caracteristicilor unui sunet asupra altuia. Caracteristicile pot fi anvelopa , spectrul sau structura temporală a semnalului. Adesea se vorbește despre timbre morphing - procesul de combinare a două sau mai multe sunete de timbru diferit pentru a obține un nou sunet, al cărui timbru include caracteristicile individuale ale ambelor sunete [1] .

În procesarea audio, morphing-ul este de obicei folosit pentru a rezolva două tipuri de probleme:

Cum funcționează

Morphing-ul este similar în principiu cu un vocoder , în care timbrul unui instrument este controlat de caracteristicile dinamice ale producției de sunet a altuia. Când o persoană pronunță un sunet, aparatul său de vorbire funcționează ca un sistem complex de filtre, trecând prin care se transformă unda sonoră dată de corzile vocale. Dacă un alt sunet, de exemplu, o chitară, este aplicat prin același sistem de filtrare, atunci va începe să „vorbească”. În acest caz, se vorbește de morphing spectral sau de frecvență.

În plus, există o transformare în timp. De exemplu, sunetul unei coarde de chitară are un atac rapid și o decădere lungă, în timp ce trompetele, dimpotrivă, au un atac lent și o decădere rapidă. Morfizarea temporală este că este posibil să înlocuiți timbrul original, păstrând în același timp principiile reproducerii.

Morphing-ul este, de asemenea, similar cu modulația de amplitudine, cu toate acestea, cu morphing, fiecare bandă de frecvență are propria sa formă de modificare a amplitudinii.

Implementare

Există multe implementări de morphing. În majoritatea dintre ele, efectul audio este obținut prin interpolarea caracteristicilor semnalului obținute folosind metode de analiză sau sinteză, cum ar fi transformarea Fourier în fereastră , modelarea sinusoidală sau codificarea predicției liniare. Următorii sunt cei mai comuni algoritmi de morphing audio.

Interpolare liniară cu tranziții netede

Una dintre primele abordări utilizate pentru implementarea sarcinilor de transformare audio a fost interpolarea liniară și crossfade. În acest caz, semnalul de ieșire este determinat de formula:

,

unde și sunt semnalele de intrare, este coeficientul de interpolare.

În special, cu ajutorul crossfade - o scădere lină a volumului unui sunet în același timp cu o creștere lină a volumului altuia - are loc o transformare treptată a unui sunet în altul (în timp ce valoarea trebuie să se schimbe), și datorită interpolării liniare, semnalul de ieșire are o caracteristică medie a semnalelor originale.

În ciuda faptului că aceste abordări sunt convenabile pentru calcule, ele sunt rareori utilizate în practică, deoarece cu ajutorul lor este imposibil să se creeze un sunet de înaltă calitate cu ajutorul lor dacă timbrele semnalelor de intrare sunt foarte diferite - ambele semnale originale sunt se aude în semnalul de ieșire.

Amplitudine morphing

Transformarea amplitudinii se realizează urmărind anvelopa semnalului. Pentru a face acest lucru, este selectată anvelopa de amplitudine a semnalului de control, care este apoi utilizat pentru a controla amplitudinea semnalului sintetic. De exemplu, amplitudinea anvelopei vorbirii poate fi utilizată pentru a controla amplitudinea zgomotului de bandă largă. În acest caz, zgomotul va suna ca și cum ar fi rostit cu voce tare. Rafinarea acestei metode a condus la inventarea vocoderului, unde acest algoritm este aplicat în fiecare dintre benzile de frecvență în care sunt împărțite vocea și zgomotul.

Morphing-ul se realizează prin modificarea amplitudinii semnalului de intrare utilizând o anvelopă de amplitudine predefinită sau amplitudinea unui alt semnal. Dacă se utilizează un plic de semnal gata făcut, atunci semnalul de intrare este înmulțit cu semnalul de ieșire al generatorului de anvelope. Dacă este utilizat un semnal de control, atunci este necesar să selectați mai întâi anvelopa de amplitudine a acestui semnal. Pentru măsurători precise, trebuie utilizat un detector RMS. Cu toate acestea, amplitudinea semnalelor instrumentelor acustice variază de obicei puțin, iar volumul lor depinde mai mult de modificările spectrului decât de modificările de amplitudine. Dacă volumul semnalului de ieșire ar trebui să fie similar cu volumul semnalului de control, atunci este necesar să se extindă intervalul dinamic al semnalului de control. [2]

Variațiile de amplitudine ale semnalului de control aplicate semnalului de intrare creează un efect care este perceput în domeniul timpului sau al frecvenței semnalului în funcție de frecvența semnalului de modulare. Pentru frecvențele sub 20 Hz, acest efect apare în domeniul timpului și se numește urmărire a amplitudinii. Pentru frecvențele de peste 20 Hz, acest efect este perceput în domeniul frecvenței și se numește modulație de amplitudine .

Dacă semnalul de control are o lățime de bandă largă , atunci lățimea spectrului de semnal trebuie redusă folosind un bloc de mediere a semnalului. O constantă tipică de timp de decadere în blocul de mediere a semnalului este de 30...100 ms. Aceste valori netezesc amplitudinea semnalului, astfel încât acesta să rămână în intervalul sub-audio. Cu toate acestea, este adesea de dorit să se transforme atacurile semnalului de intrare fără mediere. Prin urmare, se recomandă utilizarea unor valori mai mici pentru constanta de timp de atac decât pentru constanta de timp de cădere. O constantă tipică de timp de atac al semnalului este de 1...30 ms.

Variațiile de amplitudine ale semnalului de intrare și ale semnalului de control pot fi în antifază, reducând astfel impactul efectului, sau pot fi în fază, ceea ce duce la o extindere a intervalului dinamic. Pentru ca variațiile de amplitudine ale semnalului de ieșire să fie similare cu variațiile de amplitudine ale semnalului de control, se recomandă trecerea mai întâi a semnalului de intrare printr- un compresor limitator .

Sinteză încrucișată

Ideea sintezei încrucișate este de a combina două semnale în așa fel încât spectrul primului semnal să fie format folosind spectrul celui de-al doilea semnal, în timp ce înălțimea primului sunet este păstrată. Această metodă poate fi îmbunătățită prin eliminarea anvelopei spectrale a primului semnal înainte de filtrare.

Sinteza încrucișată constă din următorii pași [3] :

  1. Efectuați o transformată Fourier în fereastră pentru fiecare dintre semnalele de intrare.
  2. Calculați anvelopa spectrală pentru fiecare cadru.
  3. În plus, împărțiți spectrul fiecărui cadru al semnalului purtător în plicul său spectral, făcându-l astfel plat.
  4. Înmulțiți un cadru spectral plat cu anvelopa cadrului modulator corespunzător, înlocuind astfel anvelopa purtătoare cu cea modulantă.
Analiza cepstrală

Procesarea semnalului bazată pe analiza cepstrală este numită și homomorfă . Folosind cepstrul, puteți obține anvelopa spectrală a semnalului. Modificarea sunetului se realizează prin filtrarea anvelopei inverse urmată de filtrarea anvelopei celui de-al doilea semnal . Conectarea ambelor filtre în serie duce la o funcție de transfer de forma . Având în vedere că , filtrarea se bazează pe diferența dintre două plicuri spectrale. Filtrarea inversă a primului semnal și filtrarea ulterioară a anvelopei spectrale a celui de-al doilea semnal pot fi efectuate într-o singură etapă folosind convoluția rapidă.

Simulare sinusoidală

Atunci când se utilizează un model sinusoidal, caracteristicile spectrale variabile în timp sunt reprezentate ca sume de sinusoide, numite armonizări . Semnalul de intrare poate fi reprezentat astfel [4] :

,

unde este amplitudinea celei de-a n-a sinusoide, este faza celei de-a n-a sinusoide, N este numărul de acorduri luate în considerare.

O idee mai generală poate fi obținută folosind un model sinusoidal cu un rest. Poate fi considerată o generalizare asupra transformării Fourier cu ferestre și modelării sinusoidale. Folosind această abordare, este posibil să se determine care parte a informației spectrale este prezentată sub formă de sinusoide și care este restul transformării Fourier cu ferestre. Când este bine analizat, acesta este un model foarte flexibil și eficient care păstrează o bună fidelitate sonoră. Cu această abordare, reprezentarea sinusoidală este utilizată numai pentru tonuri stabile, iar restul ar trebui să fie în mod ideal o componentă stocastică. Semnalul de intrare arată astfel:

,

unde este componenta de zgomot la timp (în secunde).

Acest algoritm oferă trei factori de interpolare, fiecare dintre care poate fi utilizat pentru a controla sunetul generat: frecvența fundamentală , timbrul armonic și anvelopa reziduală.

Aplicație

Morphing-ul este utilizat în mod activ în industria divertismentului: sunetele create sunt folosite în coloanele sonore ale filmelor și în reclamele la televizor. Morphing-ul este folosit și în experimentele psihoacustice, în special, pentru a studia spațiul timbrelor.

Morphing-ul poate fi folosit pentru a crea sunete noi cu diferite caracteristici, precum și pentru a oferi o sinteză mai realistă a tonurilor naturale, care poate fi aplicată, de exemplu, prin creșterea volumului unui sunet liniștit.

Unul dintre cele mai faimoase exemple de audiomorfizare a fost recrearea vocii lui Farinelli pentru un film despre viața unui celebru castrato din secolul al XVIII-lea. Apoi morphing-ul a fost folosit pentru a crea gama vocii cântăreței prin combinarea sopranei coloraturii și contratenorului .

Note

  1. Holloway B., Tellman E., Haken L. Timbre Morphing of Sounds with Unequal Numbers of Features. // Jurnalul Societății de Inginerie Audio - 1995 - Nr. 43 (09) - p. 678-689.
  2. DAFX - Digital Audio Effects / Ed. Udo Zolzer. - Chichester: John Wiley & Sons, 2002. - 554 p.
  3. Sinteză încrucișată . Data accesului: 15 ianuarie 2014. Arhivat din original pe 27 decembrie 2013.
  4. F. Primavera, F. Piazza și J. Reiss . Morphing audio pentru generarea de sunet hibrid percutant. – În Proc. A 45-a # „Conferința Societății de Inginerie Audio”, 2012. - 8 p.

Lectură recomandată

  • DAFX - Efecte audio digitale / Ed. Udo Zolzer. - Chichester: John Wiley & Sons, 2002. - 554 p.
  • Serra, X. Modelarea sunetului muzical cu sinusoide plus zgomot. — Swets & Zeitlinger, 1997. — p. 91-122.
  • Progrese în procesarea semnalelor audio și vocale: tehnologii și aplicații / Ed. Hector Perez Meana. - Idea Group Inc (IGI), 2007. - 446 p.