Adnotare automată a imaginii

Adnotarea automată a imaginii (cunoscută și sub denumirea de etichetare automată a imaginii sau indexare lingvistică ) este procesul prin care un sistem informatic atribuie automat metadate sub formă de subtitrări sau cuvinte cheie unei imagini digitale . Această aplicație a tehnicilor de viziune computerizată este utilizată în sistemele de recuperare a imaginilor pentru a organiza și prelua imagini dintr-o bază de date de interes.

Această metodă poate fi văzută ca un tip de clasificare a imaginilor cu mai multe clase, cu un număr foarte mare de clase - dimensiunea este comparabilă cu vocabularul. De obicei, analiza imaginilor sub formă de vectori de caracteristici extrase și cuvinte de antrenament pentru adnotări este utilizată de tehnicile de învățare automată pentru a încerca să aplice automat adnotări la imagini noi. Primele metode au studiat corelațiile dintre caracteristicile imaginii și adnotările de antrenament, apoi au fost dezvoltate metode folosind traducerea automată pentru a încerca să traducă un dicționar de text cu „vocabul vizual” sau regiuni grupate cunoscute sub numele de blobs. Lucrările în urma acestor eforturi au inclus abordări clasificatorii, modele de relevanță și așa mai departe.

Avantajul adnotării automate a imaginii față de căutarea de imagini de conținut (CBIR) este că interogările pot fi specificate mai natural de către utilizator. [1] CBIR de obicei (în prezent) solicită utilizatorilor să caute concepte de imagine, cum ar fi culoarea și textura, sau să găsească exemple de interogări. Unele caracteristici ale imaginilor din imaginile eșantion pot suprascrie conceptul asupra căruia utilizatorul este de fapt concentrat. Metodele tradiționale de căutare a imaginilor se bazează pe imagini etichetate manual, ceea ce este un proces costisitor și consumator de timp, mai ales având în vedere bazele de date mari și în continuă creștere existente.

Mai multe motoare sunt conectate la Internet, inclusiv un motor de marcare în timp real [2] dezvoltat de cercetătorii de la Universitatea de Stat din Pennsylvania și Behold. Companii precum Playment, Edgecase.ai, Microsoft VOTT.ai și dataloop.ai au creat motoare de adnotare video automate încorporate. Companii precum Alegion.com, Infolks, DataPure.co, Scaleapi.com, Diffgram.com, Figure-eight.com oferă o combinație de adnotare automată a imaginii cu o combinație de revizuire manuală atunci când automatizarea eșuează.

Note

  1. Masashi Inoue. Despre nevoia de recuperare a imaginilor pe bază de adnotări  // Institutul Național de Informatică 2-1-2 Hitotsubashi, Chiyoda-ku Tokyo, Japonia.
  2. ALIPR.com (downlink) . Arhivat din original pe 3 martie 2016.