Învățarea cu un profesor

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 12 aprilie 2020; verificarea necesită 1 editare .

Învățarea supravegheată este una dintre metodele de învățare automată  , în timpul căreia sistemul testat este forțat să învețe folosind exemple stimul-răspuns. Din punctul de vedere al ciberneticii , este unul dintre tipurile de experiment cibernetic . Poate exista o anumită relație între intrări și ieșiri de referință (stimul-răspuns), dar acest lucru este necunoscut. Este cunoscut doar un set finit de precedente  - perechi stimul-răspuns, numite eșantion de antrenament . Pe baza acestor date, se cere restabilirea dependenței (construirea unui model de relații stimul-răspuns potrivit pentru prognoză), adică construirea unui algoritm capabil să dea un răspuns destul de precis pentru orice obiect. Pentru a măsura acuratețea răspunsurilor, precum și în învățarea prin exemple , se poate introduce un funcțional de calitate .

Principiul înființării acestui experiment

Acest experiment este un caz special de experiment cibernetic cu feedback. Înființarea acestui experiment presupune existența unui sistem experimental, a unei metode de antrenament și a unei metode de testare a sistemului sau de măsurare a caracteristicilor.

Sistemul experimental, la rândul său, este format din sistemul testat (utilizat), spațiul de stimuli recepționați din mediul extern și sistemul de control al întăririi (regulator al parametrilor interni). Ca sistem de control al armăturii, poate fi utilizat un dispozitiv de control automat (de exemplu, un termostat) sau un operator uman (profesor), capabil să răspundă la reacțiile sistemului testat și la stimulii mediului prin aplicarea unor reguli speciale de armare care schimbă starea. a memoriei sistemului.

Există două opțiuni: (1) când răspunsul sistemului testat nu modifică starea mediului și (2) când răspunsul sistemului modifică stimulii mediului. Aceste scheme indică asemănarea fundamentală a unui astfel de sistem general cu sistemul nervos biologic.

Tipologia sarcinilor de învățare supravegheată

Tipuri de date de intrare

Tipuri de răspuns

Tipuri degenerate de sisteme de control al armaturii („profesori”)

Această distincție permite o privire mai profundă asupra diferențelor dintre diferitele moduri de învățare, deoarece linia dintre învățarea supravegheată și nesupravegheată este mai subtilă. În plus, o astfel de diferență a făcut posibilă arătarea anumitor limitări pentru rețelele neuronale artificiale pentru sistemele controlate S și R (vezi Teorema de convergență a Perceptronului ).

Vezi și

Literatură