Centru geometric

Centrul geometric al unei mulțimi discrete de puncte din spațiul euclidian (în termeni statistici - eșantioane) este punctul în care suma distanțelor până la punctele mulțimii este minimizată. Centrul geometric generalizează mediana la o statistică matematică care minimizează distanțele într-un eșantion de date unidimensionale. Astfel, centrul geometric reflectă tendința centrală în spațiile cu dimensiuni mari. Conceptul este cunoscut și sub numele de 1-mediană [1] , mediană spațială [2] , sau punct Torricelli [3] .

Centrul geometric este un estimator de deplasare important în statistică [4] , în care acest concept este cunoscut sub numele de scor L 1 [5] . Găsirea centrului geometric este, de asemenea, o sarcină standard la plasarea obiectelor , unde locația obiectelor (producție sau consum) este modelată pentru a minimiza costurile de transport [6]

Un caz special al problemei pentru trei puncte din plan (adică m =3 și n =2 în termenii descriși mai jos) este uneori descris ca problema lui Fermat. Ea apare în construcția arborilor Steiner minimali și a fost mai întâi pusă ca o problemă de Pierre de Fermat și rezolvată de Evangelista Torricelli [7] . Soluția la această problemă este acum cunoscută ca punctul Fermat al triunghiului [8] . La rândul său, căutarea centrului geometric poate fi generalizată la problema minimizării sumei distanțelor ponderate . Această problemă este cunoscută ca problema Weber deoarece Alfred Weber a discutat această problemă într-o carte din 1909 despre plasarea obiectelor [2] . Unele surse folosesc în schimb denumirea de problemă Fermat–Weber [9] , dar unele surse folosesc același nume pentru problema neponderată [10]

Vesolovsky [11] a dat un studiu al problemei centrului geometric. Vezi articolul lui Fekete, Michel și Boyer [12] pentru o discuție despre generalizarea problemei în cazul mulțimilor nediscrete.

Definiție

Formal, având în vedere o mulțime care conține m puncte , unde toate , centrul geometric este definit ca

centru geometric

Rețineți că aici arg min înseamnă valoarea argumentului la care este atinsă suma minimă. Acesta este punctul pentru care suma tuturor distanțelor euclidiene la , este minimă.

Proprietăți

Ocazii speciale

Calcul

Deși conceptul de centru geometric este ușor de înțeles, calculul său este dificil. Centroidul unui triunghi (adică centrul său de masă ), definit în mod similar cu centrul geometric ca minimizând suma distanțelor pătrate până la fiecare punct, poate fi obținut folosind formule simple - coordonatele sale sunt media aritmetică a coordonatelor lui punctele. Cu toate acestea, nu se cunoaște o astfel de formulă simplă pentru centrul geometric. S-a demonstrat chiar că nu există nici o formulă explicită , nici un algoritm exact care să utilizeze doar operații aritmetice și radix. Astfel, există doar aproximări pentru rezolvarea acestei probleme [16] .

Cu toate acestea, este posibil să se calculeze o aproximare a centrului geometric folosind o procedură iterativă în care fiecare pas oferă o aproximare mai precisă. Procedurile de acest tip pot fi derivate din faptul că suma distanțelor până la punctele de eșantion este o funcție convexă , deoarece distanța până la fiecare punct de eșantion este o funcție convexă, iar suma funcțiilor convexe este, de asemenea, o funcție convexă. Astfel, procedura de reducere a sumei distanțelor nu se poate încadra în optimul local .

O astfel de abordare este algoritmul Weisfeld ( André Weisfeld ) [17] [18] [19] care este un tip de metodă iterativă a celor mai mici pătrate ponderate cu ponderi diferite. Acest algoritm stabilește un set de greutăți care sunt invers proporționale cu distanțele față de aproximarea curentă și calculează o nouă aproximare care este media ponderată a punctelor eșantionului în funcție de aceste greutăți. Acesta este

Metoda converge din aproape toate pozițiile inițiale, dar poate eșua dacă aproximarea ajunge la unul dintre punctele eșantionului. Algoritmul poate fi modificat în așa fel încât să convergă pentru toate punctele de plecare [14] .

Bose, Mageshwari și Morin [10] au descris o procedură de optimizare mai sofisticată pentru găsirea unei soluții optime aproximative pentru o problemă dată. După cum au arătat Ne, Parrilo și Starmfils [20] , problema poate fi gândită ca o problemă de programare semidefinită .

Cohen, Lee, Miller și Pachoki [21] au arătat cum se calculează centrul geometric la o precizie arbitrară în timp aproape liniar.

Descrierea centrului geometric

Dacă punctul y este diferit de toate punctele eșantion date x j , atunci y este centrul geometric dacă și numai dacă

Aceasta este echivalentă cu

care este strâns legat de algoritmul Weisfeld.

În general, y este un centru geometric dacă și numai dacă există vectori u j astfel încât

unde pentru x j ≠ y ,

iar pentru x j = y ,

O formulare echivalentă a acestei afecțiuni

Generalizări

Centrul geometric poate fi generalizat de la spații euclidiene la varietăți riemanniene generale (și chiar spații metrice ) folosind aceeași idee care este folosită pentru a defini media Fréchet pe varietățile riemanniene [22] . Fie o varietate Riemanniană cu o funcție de distanță , fie ponderi care însumează 1 și fie observații din . Apoi definim centrul geometric ponderat (sau media ponderată Fréchet) al punctelor de date

.

Dacă toate greutățile sunt egale, spunem care este centrul geometric.

Note

  1. ↑ Problema k -mediană mai generală se întreabă despre poziția k centrelor minimizând suma distanțelor de la fiecare punct al mulțimii la cel mai apropiat centru.
  2. 1 2 Drezner, Klamroth, Schöbel, Wesolowsky, 2002 .
  3. Cieslik, 2006 .
  4. Lawera, Thompson, 1993 .
  5. 1 2 3 4 Lopuhaä, Rousseeuw, 1991 .
  6. Eiselt, Marianov, 2011 .
  7. Krarup, Vajda, 1997 .
  8. Spania, 1996 .
  9. Brimberg, 1995 .
  10. 1 2 Bose, Maheshwari, Morin, 2003 .
  11. Wesolowsky, 1993 .
  12. Fekete, Mitchell, Beurer, 2005 .
  13. 1 2 3 Haldane, 1948 .
  14. 12 Vardi, Zhang, 2000 .
  15. Cieslik, 2006 ; Plasterie, 2006 . Cazul convex a fost dovedit pentru prima dată de Giovanni Fagnano .
  16. Bajaj, 1986 ; Bajaj, 1988 . Anterior Cockayne și Melzak Cockayne, Melzak, 1969 au demonstrat că punctul Steiner pentru 5 puncte din plan nu poate fi construit folosind o busolă și o linie dreaptă.
  17. Weiszfeld, 1937 .
  18. Kuhn, 1973 .
  19. Chandrasekaran, Tamir, 1989 .
  20. Nie, Parrilo, Sturmfels, 2008 .
  21. Cohen, Lee, Miller, Pachocki, Sidford, 2016 .
  22. Fletcher, Venkatasubramanian, Joshi, 2009 .

Literatură