Segmentarea (procesarea imaginii)

În viziunea computerizată , segmentarea  este procesul de împărțire a unei imagini digitale în mai multe segmente ( un set de pixeli , numit și superpixeli). Scopul segmentării este de a simplifica și/sau schimba reprezentarea unei imagini astfel încât să fie mai simplu și mai ușor de analizat. [1] Segmentarea imaginii este folosită în mod obișnuit pentru a evidenția obiecte și limite (linii, curbe etc.) în imagini. Mai precis, segmentarea imaginii este procesul de atribuire a etichetelor fiecărui pixel dintr-o imagine, astfel încât pixelii cu aceeași etichetă să împărtășească caracteristici vizuale.

Rezultatul segmentării imaginii este un set de segmente care acoperă împreună întreaga imagine sau un set de contururi extrase din imagine (vezi Extragerea marginilor ). Toți pixelii dintr-un segment sunt similari în anumite caracteristici sau proprietăți calculate, cum ar fi culoarea , luminozitatea sau textura . Segmentele învecinate diferă semnificativ în această caracteristică. [unu]

Aplicație

Câteva aplicații practice ale segmentării imaginii sunt:

Au fost dezvoltați mai mulți algoritmi și metode universale pentru segmentarea imaginilor. Deoarece nu există o soluție generală pentru problema segmentării imaginii, adesea aceste metode trebuie să fie combinate cu cunoștințele din domeniul de studiu pentru a rezolva eficient această problemă în domeniul său.

Metode bazate pe clustering

k-means  este o metodă iterativă care este utilizată pentru a împărți o imagine în K clustere. Algoritmul de bază este prezentat mai jos:

  1. Alegeți K centre de cluster, aleatoriu sau pe baza unor euristice ;
  2. Plasați fiecare pixel de imagine în grupul al cărui centru este cel mai aproape de acest pixel;
  3. Recalculați centrele clusterului făcând media tuturor pixelilor din cluster;
  4. Repetați pașii 2 și 3 până la convergență (de exemplu, când pixelii rămân în același cluster).

Aici, suma pătratelor sau a valorilor absolute ale diferențelor dintre pixel și centrul clusterului este de obicei luată ca distanță . Diferența se bazează de obicei pe culoare, luminozitate, textura și locația pixelilor sau pe o sumă ponderată a acestor factori. K poate fi ales manual, aleatoriu sau euristic.

Este garantat că acest algoritm va converge, dar este posibil să nu conducă la o soluție optimă. Calitatea soluției depinde de setul inițial de clustere și de valoarea lui K .

Metode de histogramă

Metodele histogramei sunt foarte eficiente în comparație cu alte metode de segmentare a imaginii, deoarece necesită doar o trecere de pixeli. În această metodă, histograma este calculată pe toți pixelii din imagine, iar minimele și maximele acesteia sunt folosite pentru a găsi clustere în imagine. [1] Culoarea sau luminozitatea pot fi folosite în comparație.

O îmbunătățire a acestei metode este aplicarea recursiv la clusterele din imagine pentru a le împărți în clustere mai mici. Procesul se repetă cu clustere din ce în ce mai mici până când nu mai apar clustere. [1] [4]

Un dezavantaj al acestei metode este că poate fi dificil să găsești minime și maxime semnificative într-o imagine. În această metodă de clasificare a imaginilor, metrica distanței și potrivirea regiunilor integrate sunt similare.

Abordările bazate pe histograme pot fi, de asemenea, adaptate rapid la mai multe cadre, păstrând în același timp avantajul de viteză cu o singură trecere. Histograma poate fi construită în mai multe moduri atunci când sunt luate în considerare mai multe cadre. Aceeași abordare care este folosită pentru un singur cadru poate fi aplicată mai multor cadre și, odată ce rezultatele sunt combinate, minimele și înaltele care au fost greu de identificat devin mai vizibile. O histogramă poate fi aplicată, de asemenea, pe bază de pixeli, unde informațiile sunt utilizate pentru a determina culoarea cea mai frecventă pentru o anumită poziție a pixelului. Această abordare utilizează segmentarea bazată pe obiecte în mișcare și medii nemișcate, ceea ce oferă un alt tip de segmentare utilă în urmărirea video .

Selectarea marginilor

Extragerea marginilor  este un domeniu bine studiat în procesarea imaginilor. Granițele și marginile regiunilor sunt strâns legate, deoarece există adesea o diferență puternică de luminozitate la granițele regiunilor. Prin urmare, metodele de detectare a marginilor sunt folosite ca bază pentru o altă metodă de segmentare.

Marginile găsite sunt adesea rupte. Dar pentru a selecta un obiect din imagine, sunt necesare margini de zonă închise.

Tehnici de creștere a regiunii

Prima a fost metoda de cultivare a suprafețelor din semințe. Această metodă preia imagini și un set de semințe ca intrare. Semințele marchează obiectele care urmează să fie selectate. Regiunile cresc progresiv, comparând toți pixelii adiacenți neocupați cu regiunea. Diferența dintre luminozitatea unui pixel și luminozitatea medie a unei zone este utilizată ca măsură de similitudine. Pixelul cu cea mai mică astfel de diferență este adăugat în zona corespunzătoare. Procesul continuă până când toți pixelii au fost adăugați la una dintre regiuni.

Metoda de cultivare a suprafețelor din semințe necesită aport suplimentar. Rezultatul segmentării depinde de alegerea semințelor. Zgomotul din imagine poate face ca semințele să fie prost plasate. Metoda de creștere a regiunii fără semințe este un algoritm modificat care nu necesită semințe explicite. Începe cu o zonă  - pixelul ales aici are un efect redus asupra segmentării finale. La fiecare iterație, ia în considerare pixelii învecinați în același mod ca metoda de creștere a regiunii folosind semințe. Dar diferă prin faptul că, dacă minimul este mai mic decât pragul specificat , atunci acesta este adăugat în zona corespunzătoare . În caz contrar, pixelul este considerat foarte diferit de toate regiunile curente și este creată o nouă regiune care conține acest pixel.

O variantă a acestei metode propusă de Haralik și Shapiro (1985) [1] se bazează pe utilizarea luminozității pixelilor . Media și varianța zonei și luminozitatea pixelului candidat sunt utilizate pentru a construi statistici de testare. Dacă statistica testului este suficient de mică, atunci se adaugă un pixel în zonă, iar media și varianța zonei sunt recalculate. În caz contrar, pixelul este ignorat și utilizat pentru a crea o zonă nouă.

Metode de tăiere grafică

Tehnicile de tăiere a graficelor pot fi aplicate eficient la segmentarea imaginii. În aceste metode, imaginea este reprezentată ca un grafic ponderat nedirecționat. De obicei, un pixel sau un grup de pixeli este asociat cu un vârf, iar greutățile marginilor determină (dis)asemănarea pixelilor adiacenți. Apoi graficul (imaginea) este tăiat după criteriul creat pentru a obține clustere „bune”. Fiecare parte a nodurilor (pixeli) obținute de acești algoritmi este considerată un obiect din imagine. Unii algoritmi populari din această categorie sunt tăieturi de grafice normalizate [5] , mers aleatoriu [6] , tăiere minimă [7] , partiționare izoperimetrică [8] și segmentare minimă a arborelui de întindere [9] .

Segmentarea bazinului hidrografic

Segmentarea bazinului hidrografic consideră valoarea absolută a gradientului imaginii ca suprafață topografică. Pixelii care au cea mai mare valoare absolută a gradientului de luminozitate corespund liniilor de distribuție care reprezintă granițele regiunilor. Apa plasată pe orice pixel dintr-un bazin hidrografic comun curge până la un minim local comun de luminozitate. Pixelii de la care se scurge apa la un minim comun formează zona de captare care reprezintă segmentul.

Segmentarea modelului

Presupunerea de bază a acestei abordări este că structurile sau organele de interes au forme geometrice repetitive. Prin urmare, este posibil să se găsească un model probabilistic care să explice modificările de formă a unui organ și apoi, prin segmentarea imaginii, să se impună restricții folosind acest model ca a priori. O astfel de sarcină include (i) aducerea exemplelor de antrenament într-o poziție comună, (ii) reprezentarea probabilistică a modificărilor din eșantioanele date și (iii) inferența statistică pentru model și imagine. Metodele curente din literatura de specialitate pentru segmentarea bazată pe cunoștințe includ modele active de formă și aspect, contururi active, modele deformabile și metode de nivelare.

Segmentare multiscale

Segmentarea imaginii se realizează la diferite scări în spațiul de scară și uneori se extinde de la scară mică la scară mare.

Criteriul de segmentare poate fi arbitrar complex și poate lua în considerare atât criteriile locale, cât și cele globale. Cerința generală este ca fiecare zonă să fie conectată într-un fel.

Segmentarea semnalului ierarhic unidimensional

Lucrarea fundamentală a lui Witkin [10] [11] asupra spațiului la scară conținea ideea că un semnal unidimensional poate fi segmentat în mod unic în regiuni folosind doar un parametru care controlează scara de segmentare.

Note

  1. 1 2 3 4 5 Linda G. Shapiro și George C. Stockman (2001): „Computer Vision”, pp. 279-325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3
  2. ^ Dzung L. Pham, Chenyang Xu și Jerry L. Prince (2000): „Current Methods in Medical Image Segmentation”, Annual Review of Biomedical Engineering , volumul 2, pp. 315-337
  3. Slyusar, V.I. Metode de transmitere a imaginilor de ultra-înaltă definiție. . Prima milă. ultima milă. - 2019, nr. 2. 46 - 61. (2019). Preluat la 8 mai 2019. Arhivat din original la 8 mai 2019.
  4. Ron Ohlander, Keith Price și D. Raj Reddy (1978): „Picture Segmentation Using a Recursive Region Splitting Method”, Computer Graphics and Image Processing , volumul 8, pp. 313-333
  5. ^ Jianbo Shi și Jitendra Malik (2000): „Normalized Cuts and Image Segmentation” Arhivat 6 iunie 2011 la Wayback Machine , IEEE Transactions on pattern analysis and machine intelligence , pp 888-905, voi. 22, nr. opt
  6. Leo Grady (2006): „Random Walks for Image Segmentation” Arhivat 19 iulie 2011. , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp. 1768-1783, voi. 28, nr. unsprezece
  7. Z. Wu și R. Leahy (1993): „An optimal graph theoretical approach to data clustering: Theory and its application to image segmentation”  (link nu este disponibil) , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp. 1101-1113, voi. 15, nr. unsprezece
  8. Leo Grady și Eric L. Schwartz (2006): „Isoperimetric Graph Partitioning for Image Segmentation” Arhivat 19 iulie 2011. , IEEE Transactions on Pattern Analysis and Machine Intelligence , pp. 469-475, voi. 28, nr. 3
  9. CT Zahn (1971): „Metode teoretice grafice pentru detectarea și descrierea clusterelor de gestalt” Arhivat 18 iunie 2010 la Wayback Machine , IEEE Transactions on Computers , pp. 68-86, voi. 20, nr. unu
  10. Witkin, A.P. „Scale-space filtering”, Proc. al 8-lea int. Conf. comună. Artă. Intel., Karlsruhe, Germania, 1019-1022, 1983.
  11. A. Witkin, „Scale-space filtering: A new approach to multi-scale description”, în Proc. IEEE Int. Conf. Acoust., Speech, Signal Processing ( ICASSP ), voi. 9, San Diego, CA, martie. 1984, pp. 150-153.

Literatură

Link -uri