Criptare în telefonie analogică

Există două clase de sisteme de comunicații: digitale și analogice . Un semnal digital este un semnal care are un număr finit de niveluri discrete. Semnalele analogice sunt continue. Un exemplu tipic de astfel de semnal este un semnal vocal transmis printr-un telefon convențional. Informațiile transmise prin semnale analogice trebuie, de asemenea, protejate, inclusiv prin metode criptografice.

Există două moduri diferite de a cripta un semnal de vorbire. Primul este să amestecați ( scramble ) semnalul într-un fel. Acest lucru se realizează prin modificarea relației dintre timp, amplitudine și frecvență în intervalul utilizabil. A doua modalitate este de a converti semnalul într-o formă digitală, la care sunt aplicabile metodele obișnuite de criptare discretă. Mesajul criptat este apoi transmis pe canal folosind un modem. După decriptarea criptogramei primite, forma de undă analogică este restabilită.

Înainte de a intra în detalii, este necesar să ne oprim asupra unor caracteristici ale semnalelor de vorbire.

Caracteristicile semnalelor de vorbire

Semnalele continue sunt caracterizate prin spectrul lor. Spectrul unui semnal  este setul său echivalent de componente sinusoidale (numite și armonice sau componente de frecvență ). Spectrul semnalului se obține prin extinderea funcției care exprimă dependența formei semnalului de timp, într- o serie Fourier . Spectrul unui semnal periodic este de linie (discret), este format din armonici cu frecvente multiple. Spectrul unui semnal neperiodic este continuu. Un spectru tipic al unui semnal de vorbire este prezentat în fig. 1. Fig. unu

Componentele de frecvență în intervalele de 3-4 kHz și mai puțin de 300 Hz scad rapid. Astfel, componentele de foarte înaltă frecvență contribuie semnificativ mai puțin la semnal decât frecvențele din intervalul 500-3000 Hz.

Dacă ne limităm la frecvențe care nu depășesc 3 kHz și folosim un analizor foarte sensibil, atunci spectrul produs de unele sunete are forma unei curbe zimțate aproximativ de următoarea formă (vezi Fig. 2). Orez. 2

Vedem mai multe vârfuri în grafic, numite formanți . Modificarea acestor componente de frecvență în timp poate fi reprezentată pe un grafic tridimensional (prin adăugarea unei a treia coordonate - timpul).

Semnalul de vorbire este un purtător de informații semantice. Aceste informații, atunci când ascultați un semnal de vorbire, pot fi înregistrate ca text de mesaj. Percepția auditivă a unui semnal de vorbire este mai bogată și poartă atât informații textuale de bază, cât și informații suplimentare sub formă de accent și intonație. Unitățile elementare de informație auditivă sunt sunete elementare - foneme , iar unitățile semantice sunt silabe, cuvinte și fraze sonore. Fiecare limbă are propriul său set de foneme. De exemplu, în rusă și engleză există aproximativ 40 de foneme.

Setul de foneme este împărțit în trei clase. Vocalele formează o familie, consoanele și alte câteva sunete fonetice (pentru engleză, acestea sunt, de exemplu, sunetele ch , sh ) formează două clase numite plozive și fricative . Vocalele sunt produse prin mișcarea corzilor vocale sub influența curenților de aer. Trecând prin laringe, ele se transformă într-o serie de vibrații. Apoi, fluxul de aer trece printr-un număr de rezonatoare, dintre care principalele sunt nasul, gura și gâtul, transformându-se în foneme percepute de urechea umană. Sunetele rezultate depind de forma și dimensiunea acestor rezonatoare, dar în mare măsură sunt caracterizate de componente de joasă frecvență.

Sunetele vocale sunt produse pentru o lungă perioadă de timp. De regulă, este nevoie de aproximativ 100 ms pentru a atinge amplitudinea maximă. Sunetele explozive sunt produse prin „închiderea” fluxului de aer și apoi eliberarea acestuia cu efect exploziv. Blocarea fluxului de aer se poate face în diferite moduri - cu limba, palatul sau buzele. De exemplu, sunetul „p” este pronunțat la blocarea fluxului de aer cu buzele. Sunetele explozive se caracterizează prin componentele lor de înaltă frecvență. Până la 90% din vârfurile lor de amplitudine au o durată care nu depășește 5 ms . Fricativele sunt produse prin blocarea parțială a fluxului de aer, rezultând un sunet asemănător cu „zgomotul alb”. Acest sunet este apoi filtrat de rezonatoarele tractului vocal. Fricativa este de obicei bogată în vârfuri de amplitudine care durează 20-50 ms și se concentrează în frecvență de la 1 la 3 kHz. Un exemplu de fricativă este sunetul „sss...”

O altă caracteristică importantă a vorbirii umane este frecvența tonului . Aceasta este frecvența de vibrație a corzilor vocale. Valoarea medie a acestei frecvențe variază de la persoană la persoană, iar fiecare difuzor are o variație de octavă deasupra sau sub această frecvență centrală. De obicei, la un bărbat, frecvența fundamentală a tonului fluctuează în jurul valorii de 130 Hz, la o femeie este mai mare.

Semnalele de vorbire nu numai că transmit informații, ci oferă și informații despre caracteristicile vocii ale vorbitorului, ceea ce face posibilă identificarea acestuia prin voce. Puteți utiliza înălțimea, formanții, sincronizarea și alte caracteristici ale semnalului de vorbire pentru a încerca să formeze un semnal similar cu originalul. Această reproducere poate fi oarecum nenaturală și unele dintre caracteristicile individuale ale vorbitorului se vor pierde. Astfel de principii de reproducere stau la baza vocoderului , care va fi discutat mai târziu.

Scrambling

Luați în considerare mai întâi prima metodă de criptare a semnalelor vocale în forma lor analogică. Atunci când se evaluează puterea de criptare a semnalelor de vorbire în formă analogică, este necesar, în primul rând, să se țină cont de posibilitățile de percepție umană atunci când se ascultă semnalul rezultat și se încearcă recuperarea oricărei informații. Această percepție este foarte subiectivă: unii oameni percep după ureche mult mai bine decât alții. De exemplu, este bine cunoscut faptul că părinții înțeleg „vorbirea” copiilor lor cu mult înainte ca alți oameni să înceapă să o înțeleagă. În acest sens, se vorbește despre așa-numita inteligibilitate reziduală a semnalului .

Evaluând fiabilitatea criptării, este recomandabil să ascultați mesajele telefonice amestecate de mai multe ori la rând. Cert este că creierul uman este capabil să se adapteze la „extragerea” informațiilor și să analizeze rapid ceea ce se aude. Se întâmplă adesea ca după a doua sau a treia ascultare, o persoană să înceapă să recunoască cuvinte sau silabe individuale. Este posibil ca un amestec de fragmente diferite să ducă la înțelegerea sensului mesajului. Există chiar experți pentru înțelegerea mesajelor amestecate. Cea mai simplă formă de transformări luate în considerare sunt transformările semnalului în domeniul frecvenței: inversiuni , inversiuni ciclice și permutări de frecvență .

Transformări de semnal de frecvență

Cea mai simplă este transformarea inversării spectrului. Se realizează după cum urmează. Luați în considerare, de exemplu, un semnal situat în intervalul 300–3000 Hz (vezi Fig. 3). Orez. 3

Să încercăm să convertim semnalul în așa fel încât frecvențele înalte și joase să fie inversate. Pentru a face acest lucru, luați în considerare armonicile individuale ale semnalului nostru. Dacă  - una dintre armonici furnizate împreună cu semnalul la intrarea dispozitivului, numită mixer , atunci ieșirea sa va fi semnalul . După binecunoscuta egalitate

Valorile și pot fi alese. Prin setarea și , obținem următorul spectru de amplitudine-unghi al ieșirii mixerului (vezi Fig. 4). Orez. patru

Când luăm în considerare fiecare armonică a semnalului și ieșirea corespunzătoare a mixerului, obținem următorul grafic (vezi Fig. 5). Orez. 5

Între frecvența purtătoare sunt două benzi, numite benzi superioare și , respectiv , inferioare . Gama superioară este similară cu semnalul original, doar mutată în sus (fiecare componentă de frecvență crește cu ). Gama inferioară este o imagine în oglindă a semnalului original. Acum, alegând o frecvență purtătoare adecvată și folosind mixerul pentru a muta gama superioară, putem obține un semnal de vorbire inversat (vezi Fig. 6). Orez. 6

Alegând o frecvență purtătoare pentru diferite semnale, fiecare dintre ele poate fi transferat într-un interval de frecvență diferit. Acest lucru face posibilă transmiterea mai multor semnale telefonice pe un canal.

Transformarea inversă nu depinde de cheia secretă. Aceasta este o codificare care nu este rezistentă la atacurile unui adversar cu echipament similar. Dezvoltarea ideii unui cod invers, care vă permite să introduceți o cheie secretă, este să utilizați așa-numita inversare ciclică. Esența transformării inverse ciclice este următoarea.

După cum am observat deja, dacă semnalul inversat este în același interval cu semnalul original (300 - 3000 Hz), atunci frecvența purtătoarei este de 3300 Hz. Pentru o altă frecvență purtătoare, să zicem 4000 Hz, obținem un semnal inversat cu spectrul prezentat în Fig. 7 Fig. 7

Acest semnal nu se încadrează în banda originală. Putem fi de acord să transferăm partea din spectru care depășește 3000 Hz în partea inferioară a spectrului original (vezi Fig. 8). Orez. opt

Acest transfer al unei părți a spectrului este ideea inversării ciclice. Un invertor tipic are 4 până la 16 frecvențe purtătoare diferite. Acest lucru dă același număr de posibile deplasări ciclice. Cu ajutorul cheii, frecvența purtătoare poate fi aleasă în același mod ca și pentru cifrul de substituție simplu. De asemenea, puteți utiliza un generator de numere pseudo-aleatoare , care selectează o frecvență purtătoare variabilă. De obicei, acest lucru se face folosind un interval de 10 sau 20 ms. Un dispozitiv care implementează această metodă se numește comutator ciclic cu interval invers .

Astfel de sisteme au două slăbiciuni grave. În primul rând, există doar un număr mic de frecvențe purtătoare posibile la un moment dat, astfel încât semnalul original să poată fi reconstruit prin enumerarea lor folosind echipamente relativ simple. În al doilea rând, și mai important, inteligibilitatea reziduală a semnalului de ieșire pentru o astfel de metodă este inacceptabil de mare, ceea ce se manifestă prin ascultare directă. A treia modalitate de a schimba semnalul în domeniul frecvenței este împărțirea intervalului. Spectrul de semnal este împărțit într-un număr de sub-benzi egale, care pot fi interschimbate între ele. La aceasta putem adăuga posibilitatea inversării pentru unele subgamii. Vom ilustra această idee cu următorul exemplu.

Exemplu

Luați în considerare semnalul prezentat în fig. 9. În exemplul nostru, intervalul de frecvență este împărțit în cinci părți egale, care sunt rearanjate în conformitate cu numerotarea specificată, în timp ce prima și a cincea părți sunt inversate (vezi Fig. 10).

Sunt 5 în total în exemplul nostru! posibile permutări și posibilități de inversare. Total - opțiuni de conversie a semnalului. Acest lucru, desigur, nu este foarte mult. Situația este mai gravă cu inteligibilitatea reziduală. Dacă sunt folosite doar permutări de dungi, atunci pentru majoritatea dintre ele lizibilitatea reziduală ajunge la 10%, ceea ce, desigur, nu garantează durabilitatea. Orez. 9 Fig. zece



Unele dintre motivele pentru aceasta sunt ușor de înțeles. Acesta va fi cazul, de exemplu, dacă unele sub-domeni rămân neschimbate. În plus, se știe că, de obicei, mai mult de 40% din energia semnalului se află în primele două sub-benzi corespunzătoare primului formant. Odată ce criptoanalistul găsește pozițiile corecte ale primelor două sub-benzi și le mută în locurile potrivite, va restabili parțial semnalul și va avea o șansă bună de a înțelege fragmentul de mesaj.

Se poate încerca să îmbunătățească sistemul de securitate utilizând un număr de permutări diferite care se schimbă la intervale scurte de timp folosind un generator de numere pseudo-aleatoare . Adesea, pentru sistemele reale, cele mai bune (în ceea ce privește inteligibilitatea reziduală scăzută) sunt stocate în ROM (memoria doar pentru citire) prezentă în interiorul dispozitivului.

Chiar dacă generatorul poate genera o secvență de perioadă foarte mare și dimensiunea cheii poate fi aleasă suficient de mare, chiar și în acest caz, inteligibilitatea reziduală a unei mari proporții de transformări este atât de mare încât sistemul nu poate oferi pe deplin fiabilitatea de securitate necesară.

Același lucru se poate spune despre orice scrambler care utilizează numai acțiuni din domeniul frecvenței. Utilizarea lor este limitată doar la situațiile în care scopul este de a împiedica ascultătorul ocazional să înțeleagă conversația, sau chiar un adversar care nu are echipamentul potrivit, pentru a înțelege conversația. După cum se va vedea din cele ce urmează, sistemele mai avansate fie măresc lățimea spectrului de semnal, fie introduc întârzieri de timp în transmisie. Astfel de modificări aduc propriile lor probleme și, prin urmare, scramblerele de frecvență ar trebui utilizate numai atunci când nu este necesară robustețea garantată.

La cele de mai sus, ar trebui să adăugăm o notă despre numărul de sub-benzi utilizate de scrambler-ul de frecvență. În exemplul precedent, au fost cinci. Este clar că odată cu creșterea acestui număr, numărul de permutări posibile ar crește semnificativ, ceea ce ar duce la o creștere a stabilității sistemului. Cu toate acestea, introducerea prea multor subgami este asociată cu mari dificultăți practice. Faptul este că la recepție este necesară restabilirea semnalului inițial. Filtrele și alte componente ale circuitului introduc zgomot și nu sunt sisteme tocmai liniare. Orice transformări ale semnalului efectuate în timpul transmisiei sunt imperfecte și conduc la o deteriorare a calității acestuia la ieșire. Scramblerii sunt deosebit de sensibili la astfel de distorsiuni. Prin urmare, o creștere a numărului de sub-benzi face sistemul fie inutilizabil, fie neeconomic.

Transformări în timp ale semnalului

Să luăm acum în considerare codurile care afectează componentele de timp ale semnalului. Ele se bazează pe următoarele principii.

În primul rând, semnalul analogic este împărțit în intervale egale de timp numite cadre . Fiecare cadru, la rândul său, este, de asemenea, împărțit în părți și mai mici numite segmente . Semnalul de intrare este convertit prin rearanjarea segmentelor din fiecare cadru. Pentru a face acest lucru, semnalul de vorbire la capătul de transmisie este înregistrat pe o bandă, care este „tăiată” în părți egale, numerotate în ordine. Apoi sunt amestecate și „lipite” în altă ordine. Semnalul reprodus de pe banda lipită este transmis pe un canal de comunicație și la capătul de recepție este din nou înregistrat pe o bandă, care, la rândul ei, este tăiată în aceleași părți ca și în timpul transmisiei. Părțile sunt „lipite” în ordinea crescătoare a numerelor și semnalul este restabilit.

Ilustram acest proces cu următorul exemplu.

Exemplu

Pe fig. Cadrul 11 ​​este împărțit în 8 segmente. Segmentele sunt apoi rearanjate în funcție de permutare

Când configurați sistemul, trebuie să selectați lungimile cadrului și segmentelor. Deoarece semnalul nu este distrus în interiorul segmentului, este de dorit să alegeți segmente atât de scurte încât să nu conțină fragmente întregi ale mesajului, de exemplu, cuvinte individuale. Pe de altă parte, lungimea segmentului afectează grav calitatea sunetului semnalului transmis, ceea ce se explică din motive pur tehnice. Cu cât segmentul este mai mic, cu atât calitatea sunetului este mai scăzută. Prin urmare, este necesar un compromis rezonabil în alegerea lungimii segmentului. Orez. 11 La alegerea lungimii cadrului, este necesar să se țină cont de factorul de întârziere între semnalul analogic de intrare care intră în echipament și semnalul analog reconstruit la recepție. Pentru a înțelege acest lucru, să revenim la ultimul exemplu (vezi Fig. 10). Fie segmentul din exemplul nostru un interval de timp în T s. Apoi, intrarea a opt segmente de vorbire la intrarea codificatorului durează 8 T s. Permutarea segmentelor ar putea fi astfel încât al optulea segment să fie primul (adică să fie transmis prin canalul de comunicație în primul rând). Într-un astfel de caz, transmisia nu poate începe înainte ca întregul cadru să fi fost introdus în scrambler. Acest lucru va necesita 8 T s. De la începutul transmisiei cadrului până la sfârșitul acesteia, sunt necesare încă 8 T s. Prin urmare, o întârziere este inevitabilă. Receptorul nu poate începe decriptarea până când întregul cadru nu a fost primit. Astfel, chiar dacă timpul de transmisie nu este luat în considerare, întârzierea este de 16 T s per segment de vorbire. În general, pentru un sistem care funcționează cu m segmente pe cadru, timpul de întârziere poate fi de 2 mT s. Din punctul de vedere al utilizatorului, acest lucru este nedorit și o astfel de întârziere ar trebui redusă la minimum. Cu toate acestea, cadrele suficient de lungi sunt de dorit pentru a crește securitatea criptării. Pentru a verifica acest lucru, notăm următoarele.


Când discutăm despre proprietățile fonemelor, am putea observa că proprietățile sunetului vorbirii sunt păstrate pentru un interval de timp destul de lung (structura formanților se modifică lent). Dacă cadrul este atât de mic încât constă dintr-un singur ton, atunci indiferent cum îl amestecăm, rezultatul va fi un singur ton continuu (cu o anumită pierdere a calității audio ca urmare a intervenției noastre). Nu vom putea realiza o dispersie suficientă a segmentelor din cauza numărului lor mic. Acest lucru poate face ca părți semnificative ale cuvintelor să rămână neschimbate, permițând ascultătorului să recunoască o parte din mesaj.

De asemenea, nu există o modalitate evidentă de a alege lungimea segmentelor. În practică, este necesar să se verifice experimental orice alegere a lungimii segmentului. De obicei, un test bun pentru acest lucru este încercarea de a reproduce după ureche rezultatul amestecării numerelor rostite aleatoriu de la 1 la 10. Este clar că această problemă este mult mai simplă decât atunci când vrei să cunoști un mesaj despre care nu se știe nimic. Experimentele arată că, dacă lungimea cadrului nu este suficient de mare, atunci sistemele luate în considerare nu rezistă bine la un astfel de test. În cele mai multe cazuri, în echipamentele de acest tip, cadrele sunt împărțite într-un număr de segmente variind de la 8 la 16, fiecare segment având o durată de obicei de la 20 la 60 ms.

Pe lângă alegerea lungimii cadrului și segmentelor, permutarea este un parametru important. Evident, unele permutări sunt mai bune decât altele și este necesar să se determine cum ar trebui să fie alese și cum să-și gestioneze alegerea. Ca și în cazul transformărilor inverse și al permutărilor de frecvență, există mai multe opțiuni pentru utilizarea sistemului de bază. Puteți alege o permutare fixă ​​pentru a transforma fiecare cadru. O altă variantă este legată de alegerea (cu ajutorul unei chei) a mai multor permutări și utilizarea periodică a acestora. Cel mai bun mod este să utilizați un generator pseudo-aleatoriu pentru a alege permutarea folosită pentru a transforma fiecare cadru individual. Pentru o astfel de variantă, problema lungimii perioadei secvenței corespunzătoare de permutări este relevantă, deoarece utilizarea repetată a aceleiași permutări este nedorită. La rândul său, aceasta este legată de alegerea numărului de segmente din cadru. De exemplu, dacă acest număr este 8 și fiecare segment are o durată de 40 ms, atunci după 3,6 ore. permutările de funcționare continuă vor începe să se repete.

După cum am observat deja, nu toate permutările sunt „bune” în ceea ce privește fiabilitatea criptării. De exemplu, dacă ascultați semnalul după ce ați aplicat fiecare dintre cele două înlocuiri

, , (1)

atunci am găsi în primul caz o inteligibilitate reziduală mult mai mare decât în ​​al doilea.

Observație . În (1), permutările luate în considerare sunt rândurile de permutare de jos, unde rândurile de sus sunt ordinele segmentelor originale și rândurile de jos sunt ordinele de segmente după permutare.

Motivul acestei diferențe de permutări (1) este că, în prima dintre ele, simbolurile 1, 4, 5, 8 rămân nemișcate, iar restul sunt deplasate numai în pozițiile învecinate, în timp ce în a doua are loc o amestecare mai bună.

Exemplul luat în considerare conduce la o măsură cantitativă naturală a „calității” unei permutări. Fie, pentru o permutare arbitrară α , simbolul α(i) indică poziția în care α mută segmentul i -al. Apoi, decalajul simbolului i după permutare este , iar deplasarea medie după permutare este caracterizată de valoarea

Pentru prima substituție din (1), polarizarea medie s(α) este 0,5, pentru a doua este 2,5. Valoarea s(α) se numește factor de deplasare al substituției α . S-a observat că permutările care au ca rezultat un semnal de ieșire cu inteligibilitate reziduală scăzută au un factor de deplasare mare, deși invers poate să nu fie adevărat. De exemplu, iată o substituție α a opt elemente cu un factor de deplasare de 4, care nu rezistă bine „testelor de auz”:

. (2)

În plus față de factorul de forfecare scăzut, prima substituție din (1) are alte proprietăți nedorite. Luați în considerare, de exemplu, segmentele învecinate 4 și 5. În cadrul amestecat, acestea sunt situate în aceeași ordine ca în cel original. Dacă segmentele au o lungime de 40 ms, atunci perechea de segmente în cauză este de aproximativ 80 ms. După cum am observat deja, majoritatea fonemelor pot fi recunoscute într-un astfel de interval de timp. În aceeași substituție, precum și în substituția (2), segmentele 6 și 8 sunt adiacente. Acest lucru este, de asemenea, nedorit. Faptul este că, atunci când ascultă o pereche de segmente învecinate de tip i, i + 2 într-un semnal amestecat, creierul uman este de obicei capabil să restabilească segmentul lipsă i + 1 , adică să restabilească partea corespunzătoare a mesajului. Ceva asemanator are loc si in alte cazuri.

Astfel, în situațiile luate în considerare, vorbim și de o oarecare inteligibilitate reziduală. Aceasta indică complexitatea formalizării definiției permutărilor „bune” din punct de vedere al protecției și, în consecință, complexitatea calculului acestora. Prin urmare, există diferențe semnificative în calculul numărului de permutări „bune”, acest lucru poate depinde de preferințele subiective ale dezvoltatorului.

Acum trebuie să rezolvăm întrebarea cum să selectăm permutările folosind o cheie. Există două moduri naturale de a face această alegere. Prima constă în alegerea unei permutări arbitrare a unui grad dat și apoi testarea acesteia. În funcție de se potrivește sau nu, permutarea este folosită pentru a transforma cadrul. O altă modalitate este de a preselecta toate permutările „bune” din ROM (memoria doar pentru citire) disponibile în hardware-ul însuși și de a le selecta pentru a le utiliza folosind o secvență pseudo-aleatorie. Să luăm în considerare ambele metode.

Cel mai nefavorabil pentru prima metodă este factorul timp. La sfârșitul unui interval de timp egal cu durata cadrului, trebuie să alegem următoarea permutare potrivită. În acest caz, nu este de dorit să se repete aceeași permutare, ceea ce este posibil în principiu chiar și pentru o secvență de control aleatorie. Prin urmare, este necesar controlul pentru a elimina apariția permutărilor nepotrivite. Așteptarea unei permutări adecvate necesită timp suplimentar, ceea ce este nedorit.

A doua metodă utilizează doar acele permutări care sunt înregistrate în ROM. Dacă rezerva lor nu este prea mare, atunci acest lucru îmbunătățește șansele inamicului. În cazul în care cadrul constă din nu prea multe segmente, să zicem 8, și este posibil să stocați toate permutările „bune”, a doua metodă este de preferat. Pentru a înțelege un alt avantaj al celei de-a doua metode, este necesar să se ia în considerare posibilitatea unui interceptor cu același echipament și un set complet de permutări „bune”.

Să presupunem că una dintre permutările stocate în ROM este a doua permutare de la (1) și am folosit-o pentru a amesteca cadrul. Un interceptor, care dorește să determine ce permutație să utilizeze, poate itera peste permutări inverse pool-ului de permutări stocat. Dacă memoria noastră conține și șirul de substituție inferior

, (3)

atunci interceptorul îl poate încerca (în locul celui folosit). Rezultatul aplicării succesive a substituției inițiale și a substituției inverse (3) este substituția

.

Este atât de aproape de o înlocuire identică încât aproape întotdeauna permite adversarului să restabilească cadrul original. În plus față de (3), există și alte permutări care sunt „apropiate” de cea adevărată. În cazul în care cadrul este format din 8 segmente, există destul de multe astfel de perechi de permutări „apropiate” și situația este destul de periculoasă (din punct de vedere al protecției). Ideea este că trebuie să ajustam definiția unei permutări „bune” și, prin urmare, să reducem numărul lor în memorie. Este necesar să se evite stocarea perechilor de permutări corespunzătoare permutărilor și pentru care produsul sau este aproape de permutarea identică. Dacă ROM-ul este umplut cu corecția făcută și numărul de permutări stocate este suficient de mare, atunci a doua metodă de a le alege pentru amestecarea cadrelor devine mai de preferat.

Persistența sistemelor de permutare temporară

Să luăm mai întâi în considerare problema posibilității de a recupera informațiile conținute într-un semnal amestecat prin ascultare directă. Din punctul de vedere al dezvoltatorului, trebuie găsit un echilibru între inteligibilitatea reziduală minimă și întârziere minimă.

Există o serie de moduri de a reduce lizibilitatea reziduală. Una este pur și simplu să inversați ordinea segmentelor. Observațiile arată că la utilizarea acestei metode, nivelul de ascultare cu succes scade cu aproape 10%. O altă metodă are de-a face și cu domeniul frecvenței. Aici avem în vedere utilizarea în comun a amestecării frecvenței și timpului într-un sistem bidimensional. Deși această metodă reduce rata de succes la ascultare cu aproape 20%, este mai costisitoare de implementat. Rețineți, totuși, că orice modificare a semnalului va reduce calitatea reproducerii și că distorsiunea frecvenței, în special, depinde foarte mult de zgomot și neliniaritatea transmisiei.

Prin utilizarea unor astfel de metode sau a unei combinații a acestora, inteligibilitatea reziduală poate fi redusă la un astfel de nivel încât niciun mesaj nu poate fi auzit. Acum luați în considerare problema rezistenței sistemului la atacuri mai sofisticate.

Una dintre ele este încercarea de a reordona semnalul de vorbire cadru cu cadru. Această sarcină este îndeplinită folosind un instrument numit sonograf . Acest dispozitiv reproduce sonograma fiecărui cadru. O sonogramă  este un grafic tridimensional în sistemul de coordonate timp (orizontal), frecvență (verticală), amplitudine (a treia coordonată), folosind o „scara de gri”. În această scară, negrul reprezintă amplitudinea maximă, iar albul reprezintă minimul. Modificările de amplitudine sunt reprezentate de modificări în tonuri de gri. O nuanță mai deschisă corespunzătoare unei amplitudini mai mici. Astfel, deși o sonogramă are trei dimensiuni, este de obicei prezentată în două dimensiuni.

Decriptarea unui anumit număr de cadre prin eșantionarea conținutului ROM-ului ne poate permite să determinăm o porțiune a secvenței pseudo-aleatorie suficientă pentru a determina cheia. Pentru a contracara acest lucru, este necesar un generator de secvențe pseudo-aleatoare adecvat, care să fie rezistent la o astfel de amenințare.

Să presupunem că sistemul nostru este rezistent la abordarea descrisă. Aceasta înseamnă că singurul mod în care un criptoanalist poate primi un mesaj este să decripteze fiecare cadru. Dar atunci, evident, timpul necesar restabilirii mesajului este direct proporțional cu numărul de cadre. Un criptoanalist poate automatiza procesul de iterare peste permutările conținute în ROM pentru a testa criteriul conform căruia semnalul primit este un semnal vocal (acest lucru se poate face, de exemplu, dintr-o sonogramă ). Pentru a proteja împotriva acestei posibilități, se pune din nou întrebarea creșterii numărului de permutări „bune”, ceea ce necesită o creștere a duratei cadrului și a întârzierii timpului de transmisie.

După cum am văzut mai devreme, întârzierea în timpul transmiterii cadrului transformat poate fi de două ori mai mare decât durata cadrului în sine. Aceasta este o consecință a faptului că, pentru unele permutări, segmentul ar putea fi întârziat cu durata completă a cadrului. Pentru a reduce această întârziere, puteți limita și mai mult setul de permutări utilizate, asigurându-vă că fiecare segment este întârziat „nu prea mult”. Acest lucru se realizează prin utilizarea permutărilor cu decalaje relativ mici pentru fiecare caracter.

Să rezumăm considerația scramblers.

Scramblerele sunt caracterizate printr-o ieșire analogică care se află în același interval ca și semnalul original. În plus, ele au de obicei caracteristici spectrale caracteristice și un semnal de ieșire care este o secvență de foneme de vorbire deschise (reordonate). Puterea lor depinde atât de tipul de amestecare, cât și de modul în care este implementată. În special, utilizarea unui generator pseudo-aleatoriu dependent de cheie pentru amestecare poate crește semnificativ nivelul de securitate. Fiabilitatea oricărei metode de amestecare alese depinde în mare măsură de tipul și calitatea canalului de comunicare. Scramblerele variază de la simple invertoare până la sisteme complexe de timp și frecvență de robustețe relativ ridicată. Ele sunt de obicei folosite ca sisteme de criptare temporare.

Sisteme de telefonie digitală

Pentru a converti semnalul de vorbire în formă digitală , sunt prelevate mostre , adică valori ale semnalului la intervale regulate τ. Intervalul τ ar trebui să fie atât de mic încât semnalul să nu aibă timp să se schimbe mult între probe. Acest interval este adesea denumit pasul de timp sau intervalul Nyquist . Frecvența minimă de eșantionare, adică reciproca pasului de timp de eșantionare, este determinată de teorema lui V. L. Kotelnikov , conform căreia frecvența de eșantionare ar trebui să fie de două ori mai mare decât frecvența maximă a spectrului sonor. În telefonie, această frecvență este limitată la 3,4 kHz. Prin urmare, frecvența de eșantionare trebuie să fie de cel puțin 6800 pe secundă sau 6,8 kHz. Procesul de prelevare a probelor se numește eșantionare în timp .

Pentru evaluarea digitală a probelor se utilizează procesul de discretizare a nivelului . Fiecare probă poate fi reprezentată printr-un număr corespunzător valorii probei de tensiune audio. De exemplu, dacă tensiunea sonoră este măsurată în milivolți, atunci numărul de milivolți întregi va fi contorizarea, iar 1 mV va fi pasul de eșantionare a nivelului. Raportul dintre amplitudinea maximă a tensiunii sonore și pasul de cuantizare oferă numărul maxim care trebuie obținut în timpul citirilor. Acesta determină domeniul dinamic al semnalului transmis. Pentru a transmite vorbirea cu o calitate satisfăcătoare, este suficient un interval dinamic de 30-35 dB, care corespunde numărului de pași de cuantizare de 30 în timpul probelor. În acest caz, biții sunt suficienți pentru a transmite o mostră în cod binar . Pentru transmisia muzicală de înaltă calitate, numărul de cuantizări trebuie să fie de cel puțin 10.000, ceea ce corespunde unui interval dinamic de 80 dB. În acest caz, biți sunt necesari pentru a transmite o probă .

Trecerea la transmisia digitală îmbunătățește semnificativ calitatea comunicării. Dar nu degeaba. Evaluați fluxul de informații în timpul unei conversații telefonice.

Presupunând că lățimea de bandă audio este egală, ca mai sus, cu 3,4 kHz și frecvența de eșantionare de 6,8 kHz, obținem 6800 de mostre pe secundă. Cu 30 de pași de cuantizare de nivel, fiecare probă ocupă 5 biți. Prin urmare, 34.000 de biți sau biți de informații sunt transmisi pe secundă. Rata de transfer de informații, măsurată în biți/s, poate fi exprimată prin formula , unde F este frecvența maximă a spectrului audio, N este numărul de niveluri de cuantizare. Pentru a transmite un semnal digital la o viteză de 34 Kbps, aveți nevoie de o bandă de frecvență trecută de canalul de comunicație de cel puțin 34 kHz.

Astfel, la trecerea la un semnal digital, a existat, parcă, un schimb al benzii de frecvență pentru raportul semnal-zgomot , dar schimbul este destul de profitabil. Prin extinderea lățimii de bandă de 10 ori în trecerea la transmisia digitală, reducem foarte mult raportul semnal-zgomot sau semnal-zgomot admis în canalul de comunicație, iar acest lucru se datorează unei îmbunătățiri semnificative generale a calității transmisiei.

În concluzie, să facem o remarcă. Pentru convertoarele A/D , semnalul de intrare este eșantionat la intervale regulate și apoi este transmisă o „aproximare” digitală. Există o altă modalitate de a transfera informații. Dacă, de exemplu, semnalul de intrare este un sinusoid cu o frecvență f , atunci în loc să trimitem o aproximare digitală, am putea pur și simplu să-i spunem destinatarului despre parametrii sinusoidului și să-l invităm să construiască el însuși un astfel de semnal. Acest principiu se află în centrul dispozitivelor, numite vocoder și , respectiv, lipredor . Cu ajutorul unor astfel de dispozitive se sintetizează sisteme de vorbire digitale cu o ieșire de viteză mică (1,2 - 4,8 Kbps).

Referințe

Vezi și