Caltech 101

Baza de date Caltech 101  este o bază de date mare de imagini concepută pentru dezvoltarea și testarea metodelor pentru recunoașterea modelelor și viziunea artificială . Acest set de date a fost creat în septembrie 2003 la Caltech de Fei-fei Li, Marc Aurelio Ranzato și Petro Perona. Baza de date include 9146 de imagini distribuite în 101 categorii - chipuri, ceasuri, furnici, piane și altele. Fiecare imagine este însoțită de o adnotare, precum și de un script de bibliotecă MATLAB pentru vizualizare.

Numire

Baza de date conține modele standardizate de învățare automată pentru dezvoltarea și depanarea modulelor de viziune computerizată . Pentru a îmbunătăți eficiența, este necesară o cantitate mare de date. De exemplu, metoda de recunoaștere a obiectelor în timp real propusă de Paul Viola și Michael J. Jones a fost instruită pe 4916 mostre de fețe umane cu etichete adăugate. [unu]

Pregătirea imaginii – tăierea, dimensionarea, etichetarea – necesită multă muncă manuală. În plus, fiecare dezvoltator se concentrează pe propriile sarcini și operează pe propriile date, ceea ce face necesară compararea diferitelor metode și abordări ale învățării automate. [2]

Kitul Caltech 101 este util ca alternativă pentru testarea metodelor de recunoaștere a modelelor și are următoarele avantaje:

Cu toate acestea, studii recente [3] arată că testele bazate pe mostre naturale necontrolate (cum ar fi Caltech 101) pot fi, de asemenea, serios înșelătoare, conducând dezvoltarea în direcția greșită.

Set de mostre

Imagini

Cele 9146 de imagini din baza de date sunt împărțite în 101 categorii.

Fiecare categorie are între 40 și 800 de imagini. Imaginile comune (cum ar fi fețele) au mai multe imagini decât altele.

Dimensiunea imaginii este de aproximativ 300x200 pixeli. Obiectele orientate (de ex. motociclete, avioane) sunt întotdeauna privite de la stânga la dreapta, în timp ce structurile verticale (de exemplu, case) sunt rotite pentru a fi în afara axei.

Adnotări

Fiecare imagine este însoțită de mai multe adnotări - coordonatele cadrului în care se află obiectul și o descriere detaliată.

Scriptul de bibliotecă MATLAB vă permite să încărcați o imagine și adnotarea corespunzătoare.

Aplicații

Analiză și comparație

Beneficii

Caltech 101 are următoarele beneficii:

Dezavantaje

Neajunsurile bazei de date Caltech 101 [3] [4] sunt uneori atribuite distorsiunilor introduse în mod deliberat, iar uneori unui set limitat.

Următoarele sunt notate ca dezavantaje:

Dezvoltare

Vezi și

Note

  1. P. Viola și MJ Jones, Robust Real-Time Object Detection, IJCV 2004
  2. Oertel, C., Colder, B., Colombe, J., High, J., Ingram, M., Sallee, P., Current Challenges in Automating Visual Perception. Proceedings of IEEE Advanced Imagery Pattern Recognition Workshop 2008
  3. 1 2 3 De ce este dificilă recunoașterea obiectelor vizuale din lumea reală? Pinto N, Cox DD, DiCarlo JJ PLoS Computational Biology Vol. 4, nr. 1, e27 Arhivat din original pe 15 aprilie 2013. doi : 10.1371/journal.pcbi.0040027
  4. Probleme cu setul de date în recunoașterea obiectelor. J. Ponce, TL Berg, M. Everingham, DA Forsyth, M. Hebert, S. Lazebnik, M. Marszalek, C. Schmid, BC Russell, A. Torralba, CKI Williams, J. Zhang și A. Zisserman. Către recunoașterea obiectelor la nivel de categorie, note de curs Springer-Verlag în informatică. J. Ponce, M. Hebert, C. Schmid și A. Zisserman (eds.), 2006 (link nu este disponibil) . Data accesului: 23 decembrie 2016. Arhivat din original pe 24 decembrie 2016. 
  5. F. Tanner, B. Colder, C. Pullen, D. Heagy, C. Oertel și P. ​​Sallee, Overhead Imagery Research Data Set (OIRDS) - o bibliotecă de date adnotate și instrumente pentru a ajuta la dezvoltarea computerului vision algorithms , iunie 2009, < http://sourceforge.net/apps/mediawiki/oirds/index.php?title=Documentation Arhivat 9 noiembrie 2012 la Wayback Machine > (28 decembrie 2009)
  6. L. Ballan, M. Bertini, A. Del Bimbo, A. M. Serain, G. Serra, B. F. Zaccone. Combinarea modelelor generative și discriminative pentru clasificarea imaginilor sociale din 101 de categorii de obiecte. Int. Conferință privind recunoașterea modelelor (ICPR), 2012. Arhivat din original pe 26 august 2014.

Surse