Distanța de Hamming

Hamming distance (code distance) - numărul de poziții în care caracterele corespunzătoare a două cuvinte de aceeași lungime sunt diferite [1] . Mai general, distanța Hamming este aplicată șirurilor de aceeași lungime a oricărui alfabet q - ary și servește ca metrică a diferenței (o funcție care determină distanța într-un spațiu metric ) a obiectelor de aceeași dimensiune.

Metrica a fost formulată inițial de Richard Hamming în timpul petrecut la Bell Labs pentru a defini o măsură a diferenței dintre cuvintele de cod ( vectori binari ) într-un spațiu vectorial de cuvinte de cod: în acest caz, distanța Hamming dintre două secvențe binare (vectori) și lungimea. este numărul de poziții în care sunt diferite. În această formulare, distanța Hamming a fost inclusă în Dicționarul NIST de algoritmi și structuri de date . Distanța Hamming este un caz special al metricii Minkowski (cu o definiție adecvată a scăderii):  

.

Două cuvinte cu o distanță Hamming de 1 se numesc vecini.

În unele sisteme numerice, cum ar fi codul Gray , numerele întregi codificate care diferă cu 1 au o distanță Hamming de 1. Se spune că astfel de numere sunt „adiacente”.

Codarea vecinilor este importantă în proiectarea dispozitivelor logice, unde trebuie evitate cursele logice .

Exemple

Proprietăți

Un set de cuvinte de lungime egală formează un spațiu metric , unde pentru fiecare pereche de elemente spațiale este definit un număr - distanța Hamming care satisface axiomele metricii:

  1. ( axioma identității ).
  2. ( axioma de simetrie ).
  3. ( axioma triunghiului sau inegalitatea triunghiului ).
atunci axioma simetriei rezultă din axioma identității și inegalitatea triunghiului.

Distanța de hamming este întotdeauna:

unde  este lungimea cuvintelor în caractere.

Distanța Hamming în bioinformatică și genomică

Pentru acizii nucleici ( ADN și ARN ), posibilitatea hibridizării a două lanțuri polinucleotidice cu formarea unei structuri secundare - o dublă helix  - depinde de gradul de complementaritate a secvențelor de nucleotide ale ambelor lanțuri. Pe măsură ce distanța Hamming crește, numărul de legături de hidrogen formate din perechi de baze complementare scade și, în consecință, stabilitatea lanțului dublu scade. Pornind de la o anumită distanță Hamming, hibridizarea devine imposibilă.

În divergența evolutivă a secvențelor de ADN omoloage , distanța Hamming este o măsură prin care se poate judeca timpul care a trecut de la divergența omologilor, de exemplu, lungimea segmentului evolutiv care separă genele omoloage și o genă precursoare.

Vezi și

Note

  1. Hamming distance: numărul de poziții de cifre în care cifrele corespunzătoare a două cuvinte binare de aceeași lungime sunt diferite ( Federal Standard 1037C Arhivat la 2 martie 2009 la Wayback Machine ).

Literatură