Matricea distanțelor este o matrice pătrată obiect la obiect (de ordinul n ), care conține ca elemente distanțele dintre obiecte dintr-un spațiu metric .
Proprietățile matricei sunt o reflectare a proprietăților distanțelor în sine [1] :
În general, matricea arată astfel:
Într-un sens larg, distanțele sunt o reflectare a unui astfel de concept precum diferența , care este dual cu conceptul de similaritate , iar elementele matricei de diferențe (în termeni generali, matrice de divergență) sunt duale cu elementele matricei de similaritate ( în general, matrice de convergență ). Relația dintre o măsură a asemănării și o măsură a diferenței poate fi scrisă ca , unde F este o măsură a diferenței; K este o măsură a asemănării. Prin urmare, toate proprietățile de măsurare a similitudinii pot fi extrapolate la măsurile lor de diferență corespunzătoare folosind o transformare simplă și invers.
Din punct de vedere vizual, relațiile dintre obiecte pot fi reprezentate folosind algoritmi de grupare grafică . Putem spune că distanțele sunt folosite mult mai des decât măsurile de similaritate: ele sunt mai des implementate în programele statistice ( Statistica , SPSS , etc.) în modulul de analiză a clusterelor .
Se știe [2] că există o măsură generalizată a distanțelor propusă de Hermann Minkowski :
Familia de distanțe de mai sus include:
Sunt distante folosite in afara acestei familii. Cea mai cunoscută este distanța Mahalanobis .
Este, de asemenea, interesant, ca o bună ilustrare a legăturii dintre măsurile de similaritate și diferență, distanța Yurtsev , duală cu măsura asemănării Brown-Blanque [5] :
Există șase puncte diferite pe plan (vezi imaginea). Distanța euclidiană în pixeli a fost aleasă ca metrică .
Matricea distanțelor corespunzătoare va fi egală cu
A | b | c | d | e | f | |
---|---|---|---|---|---|---|
A | 0 | 184 | 222 | 177 | 216 | 231 |
b | 184 | 0 | 45 | 123 | 128 | 200 |
c | 222 | 45 | 0 | 129 | 121 | 203 |
d | 177 | 123 | 129 | 0 | 46 | 83 |
e | 216 | 128 | 121 | 46 | 0 | 83 |
f | 231 | 200 | 203 | 83 | 83 | 0 |
Matricea rezultată poate fi reprezentată ca o hartă termică . Aici, o culoare mai închisă corespunde unei distanțe mai mici între puncte.