Distribuția de frecvență este o metodă de descriere statistică a datelor (valori măsurate, valori caracteristice). Matematic , distribuția frecvenței este o funcție care determină în primul rând valoarea ideală pentru fiecare indicator, deoarece această valoare este de obicei deja măsurată. O astfel de distribuție poate fi prezentată sub forma unui tabel sau grafic prin modelarea ecuațiilor funcționale. În statistica descriptivă , distribuția de frecvență are un număr de funcții matematice care sunt utilizate pentru a aplatiza și analiza distribuția de frecvență (cum ar fi distribuția normală Gaussiană ).
Volumul de date (valori măsurate, date de sondaj) este prima listă originală neordonată. În primul rând, trebuie sortat. Din lista inițială, în acest caz, poate exista o ușoară abatere a cuantilelor (răspândirea statistică), abaterea probabilă și abaterea standard ( regula generală : abaterea standard = distanță / 6).
Apoi atribuim o valoare fiecărei valori și le însumăm. De regulă, obținem frecvența absolută. Pe baza datelor de frecvență absolută, calculăm numărul total de valori ale eșantionului și calculăm frecvențele relative. Acum avem un set ordonat de perechi de valori (valori caracteristice și frecvențele relative asociate acestora), așa-numitul rating.
Să adăugăm frecvențele relative, începând cu cea mai mică valoare a caracteristicii și să atribuim fiecărei caracteristici valoarea sumei (inclusiv propria sa contribuție), astfel încât să obținem distribuția . Aceasta indică pentru fiecare valoare caracteristică cât de mare este proporția sa mai mică sau egală cu valoarea caracteristică corespunzătoare. Procentul începe de la 0 și crește până la 1 sau 100. Grafic, acesta este reprezentat de o curbă slabă crescătoare monotonă , care are o formă de S alungită. Există numeroase încercări de a reproduce rezultatele distribuției prin ecuații funcționale . Distribuția sumei, în funcție de valorile caracteristicilor, este cel mai simplu tip de reprezentare a distribuției de frecvență.
Conform regulilor, este necesară și clasificarea valorilor caracteristice. Această procedură împarte intervalul de valori care apar, de exemplu, în 10 sau 20 de clase de lățime egală (valori rare la margini (vezi „ valorile aberante ”) uneori grupate în clase mai mari). Apoi, densitatea funcției , derivata funcției de distribuție, este determinată în conformitate cu caracteristica valorii în cazul unei distribuții continue. În plus, frecvența poate fi determinată nu numai prin numărare, ci și, de exemplu, prin cântărire. Apoi obținem o distribuție de masă în loc de o serie de distribuție. În principiu, orice cantitate aditivă poate fi utilizată pentru a măsura frecvența. Dacă un eșantion aleatoriu este foarte diferit de o distribuție normală (curba clopot), atunci datele pot fi părtinitoare prin selectarea efectelor sau tendințelor. Diverse teste statistice oferă inferență sau analiză a varianței . Dacă mărimea eșantionului se află în suprapunerea mai multor submulți (distribuția de vârstă, profesii, grupuri), atunci distribuția frecvențelor în locul celor maxime poate fi și cu două sau multivariate.