C-Means Fuzzy Clustering Method

Metoda de grupare C-means fuzzy ( în engleză  fuzzy clustering, soft k-means, c-means ) vă permite să împărțiți setul disponibil de elemente cu o putere într-un anumit număr de seturi fuzzy . Metoda C -means fuzzy clustering poate fi considerată o metodă k -means îmbunătățită , în care pentru fiecare element din mulțimea luată în considerare, se calculează gradul de apartenență al acestuia ( responsabilitate engleză ) la fiecare dintre clustere.  

Algoritmul a fost dezvoltat de JC Dunn în 1973 [1] și îmbunătățit de JC Bezdek în 1981 [2] .

Algoritm:

  1. Setați aleatoriu centrele clusterelor ;
  2. Calculați matricea de apartenență a elementelor la clustere . În cazul unei distribuții normale : , unde este --lea element al mulțimii, este centrul clusterului ,  este distanța dintre puncte și , este densitatea de probabilitate a distribuției normale în punctul .
  3. Mutați centrele clusterului ;
  4. Calculați funcția de pierdere (de exemplu, pe baza principiului probabilității maxime ). În cazul unei distribuţii normale, funcţia de pierdere va fi egală cu: ;
  5. Dacă valoarea funcției de pierdere scade, atunci repetați ciclul de la pasul 2.

Metoda de grupare fuzzy a mijloacelor C este de o utilizare limitată datorită unui dezavantaj semnificativ - imposibilitatea de a împărți corect în clustere în cazul în care clusterele au o dispersie diferită în diferite dimensiuni (axe) ale elementelor (de exemplu, un cluster are forma unei elipse). Acest neajuns este eliminat în modelele Mixture și în algoritmii GMM ( Gaussian Mixture Models ).

Link -uri

  1. Dunn JC A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters  // Journal of Cybernetics. - 1973. - 17 septembrie ( vol. 3 , nr. 3 ). — S. 32–57 . — ISSN 0022-0280 . - doi : 10.1080/01969727308546046 .
  2. Bezdek, James C. Pattern Recognition with Fuzzy Objective Function Algorithms . - 1981. - ISBN 0-306-40671-3 .