Operator Rothwell

Operatorul Rothwell , în disciplina vederii computerizate  , este un operator pentru detectarea marginilor introdus de Charles Rothwell  la Simpozionul IEEE Computer Vision [1] în 1995.

În general, operatorul Rothwell este foarte asemănător cu operatorul Canny , diferența dintre ele este că algoritmul Rothwell folosește Detectarea marginilor # Subțierea marginilor în loc de Suprimarea non - maximică și că pragul dinamic ( în engleză dynamic thresholding ) este folosit în loc de histerezis. .    

Motive pentru creare

Autorii metodei au considerat că suprimarea non-maximală nu funcționează corect la tranzițiile din imagini din cauza procesului de netezire. Autorii au abandonat histerezisul din cauza credinței că luminozitatea marginilor nu este de o importanță fundamentală pentru un nivel superior de procesare vizuală, în special, în recunoașterea obiectelor. Contrastul era mult mai important pentru ei.

Etapele principale ale algoritmului

Prelucrare primară. Imaginea este netezită folosind o eșantionare discretă a unui filtru gaussian bidimensional. Aici, nucleele gaussiene unidimensionale separate sunt utilizate secvenţial în direcţiile x şi y. „Coada” nucleului de convoluție este de 1,5% din valorile sale centrale. Apoi se găsește un gradient pentru fiecare punct din imagine. și se calculează folosind diferențe finite centrale ale operatorilor de forma [-1,0,1]. |ΔS| (notate cu N pentru comoditate) și θ sunt calculate pentru fiecare punct folosind expresii similare cu cele din operatorul Canny:

Localizare subpixel. Pentru fiecare pixel pentru care N > (unde acesta este un prag predeterminat), unde se află de fapt pixelii de margine ( ing. Edgels ), este utilizată tehnica de căutare a maximelor locale a operatorului Canny. Locațiile pixelilor marginii se găsesc prin estimarea intersecției derivatei a doua cu zero în direcția normalei la conturul tangentei.  

Definirea pragului de imagine. După determinarea N și θ, apare problema separării pixelilor de margine și a altor puncte. Acest lucru se realizează folosind pragurile dinamice , adică operatorul definește o valoare de prag care variază în funcție de imagine .  Pragul de suprafață ( pe zone discrete ale imaginii) este calculat și utilizat pentru a clasifica pixelii marginilor ori de câte ori > α (utilizarea constantei 0 < α ≤ 1 este descrisă mai jos). se defineşte folosind elementele mulţimii Σ . Aceste margini oferă o bună indicație a marginilor puternice în zona locală. Deci atribuim o valoare pentru fiecare (x, y) є Σ , și apoi formăm o suprafață plană în bucăți, interpolată pentru toate celelalte (x, y). Selecția pragului de imagine continuă prin compararea valorii și a funcției de prag și clasificând punctul (x, y) ca margine dacă primul este cel puțin 90% din cel din urmă. Parametrul α este introdus pentru a ține cont de cazul în care marginea puternică poate deveni puțin mai departe spre tranziție. Toți pixelii care trec testul de prag sunt incluși în setul Σ, este evident că Σ este inclus în Σ.

subțierea. Procesul de prag produce o imagine a setului de elemente Σ, ai căror membri sunt pixelii de margine asociați. Un element este un „vecin” al altui element dacă se află la cel puțin 1 pixel distanță de acesta, adică aparține unui pătrat de 3x3 centrat pe al doilea element. Lățimea setului este adesea de două sau trei puncte și, prin urmare, nu reprezintă topologia curbei digitale. Subseturile sunt subțiate la lanțuri de grosime unitară. Acest proces se bazează pe algoritmul de subțiere Cao-Fu. Funcționează în așa fel încât să nu scurteze marginile lanțurilor care au un capăt liber (adică marginile cu o singură margine conectată la el). Cu toate acestea, subțierea lui Cao-Fu tratează toate elementele setului în mod egal, astfel încât, de exemplu, o margine puternică poate fi îndepărtată în contrast cu un punct mai slab. Deci localizarea crestelor este păstrată, termenii lui Σ sunt ordonați, iar elementele slabe sunt îndepărtate mai întâi. Mulțimea subțiată se numește Σ

Obținerea unei descrieri topologice. Având în vedere Σ , o descriere topologică este extrasă din imagini discrete și o interpretare geometrică subpixeli este asociată cu aceasta. Toate elementele din Σ alcătuiesc o rețea vârf-muchie-față. Vârfurile sunt situate pe margini care fie au un singur vecin (caz în care sunt capetele unui lanț de margini) sau care au mai mult de două margini asociate acestora. Topologic, un punct de colț este definit prin întâlnirea a două căi de margine conținute în aceeași muchie. Segmentarea marginilor în astfel de puncte de colț nu este efectuată. De îndată ce vârfurile sunt obținute, lanțurile de margini dintre ele sunt parcurse folosind o mască de 3 cu 3. Pe măsură ce fiecare margine este extrasă, subpixelii săi sunt trecuți în listă.

Vezi și

Note

  1. ^ IEEE International Symposium on Computer Vision Arhivat 11 ianuarie 2011 la Wayback Machine , 1995

Literatură

Link -uri