O histogramă în statistica matematică este una dintre metodele grafice pentru studierea seriei de distribuție a valorilor unei variabile aleatoare. [B:1]
Dintre metodele grafice de studiere a seriilor de distribuție sunt indicate următoarele [1] :
Poligoanele în trepte și poligoane de frecvență sunt numite în mod colectiv poligoane de distribuție . Graficul de dispersie, poligonul în trepte și poligonul de frecvență sunt indicate ca fiind cele mai convenabile. [unu]
Pentru cazul bidimensional, în loc de o serie de distribuție, se construiește un tabel de distribuție, iar construcția grafică corespunzătoare se numește prismogramă . [unu]
GOST R 50779.10-2000 a oferit următoarele definiții:
2.17 histograma
O reprezentare grafică a distribuției de frecvență pentru o caracteristică cantitativă, formată din dreptunghiuri învecinate ale căror baze sunt intervale de clasă și ale căror arii sunt proporționale cu frecvențele acestor clase
2.18 grafic cu bare
O reprezentare grafică a distribuției de frecvență pentru o variabilă aleatorie discretă, format dintr-un set de coloane de latime egala, ale caror inaltimi sunt proportionale cu frecventele[D:1]
Să fie un eșantion dintr-o anumită distribuție . Să definim o partiție a liniei reale . Lăsa
este numărul de elemente de probă care se încadrează în intervalul al-lea. Apoi o funcție constantă pe bucăți , care are forma:
, se numește histogramă normalizată.[2]Fie distribuția variabilelor aleatoare absolut continuă și dată de densitatea de probabilitate . Apoi
în probabilitate la . [3]La desenarea după metoda dreptunghiurilor, axa orizontală este împărțită în segmente egale corespunzătoare rangurilor ; pe aceste segmente, ca si pe baze, se construiesc dreptunghiuri cu inaltimea proportionala cu frecventa unei descarcari date. [patru]
Să descriem această procedură mai detaliat. În primul rând, setul de valori pe care le poate lua elementul eșantion este împărțit în mai mulți biți (bină). Cel mai adesea, aceste intervale sunt luate la fel, dar aceasta nu este o cerință strictă. Aceste intervale sunt trasate pe axa orizontală, apoi se desenează un dreptunghi deasupra fiecăruia. Dacă toate intervalele au fost aceleași, atunci înălțimea fiecărui dreptunghi este proporțională cu numărul de elemente eșantion care se încadrează în intervalul corespunzător. Dacă intervalele sunt diferite, atunci înălțimea dreptunghiului este aleasă astfel încât aria lui să fie proporțională cu numărul de elemente eșantion care se încadrează în acest interval.
Pentru construirea unei histograme este esențial să alegeți partiția optimă, deoarece pe măsură ce intervalele cresc, detaliul estimării densității distribuției scade, iar pe măsură ce intervalele scad, acuratețea valorii sale scade. Pentru a selecta numărul optim de intervale , este adesea folosită regula Sturges .
,unde este numărul total de observații ale mărimii, este logaritmul de bază 2 și este partea întreagă a .
De asemenea, se găsește adesea o regulă care estimează numărul optim de intervale ca rădăcină pătrată a numărului total de măsurători:
Reprezentarea seriei de distribuție într-o formă transformată este o condiție necesară la compararea acestor serii între ele [1] .
Studiul seriilor de distribuție este mult facilitat de utilizarea metodei grafice . La reprezentarea seriilor de distribuție, valorile descărcărilor sau valorile observate ale variabilei aleatoare sunt reprezentate grafic pe axa orizontală , iar pe axa verticală, respectiv, frecvențele de biți sau frecvențele observate [1] .
Construcția histogramelor este utilizată pentru a obține o estimare empirică a densității de distribuție a unei variabile aleatoare [5] .
În cea mai generală formă, una dintre cele mai importante sarcini este formulată astfel: la un nivel de semnificație dat, testați ipoteza că distribuția prezentată pe histogramă este monomodală [A: 1] .
Analiza histogramei este considerată în mod tradițional printre geologi ca o metodă clară și informativă pentru rezolvarea problemelor geologice, deoarece analiza histogramei permite testarea ipotezelor geologice formulate în limbajul statisticii [A: 1] .
În cardiologie, construirea și descrierea unei histograme este o metodă geometrică obligatorie pentru analiza variabilității ritmului cardiac , propusă de standardele [A: 2] [B: 2] din 1996 . Ca modalități suplimentare de a descrie histogramele ritmului cardiac, sunt utilizate metode de interpretare triunghiulară a acestora , cum ar fi indicele Sf. Gheorghe și indicele triunghiular [6] .
În producție, atunci când se analizează starea procesului tehnologic, construirea histogramelor este considerată o modalitate eficientă de a evalua situația și de a efectua o analiză în prima etapă a studierii stabilității procesului tehnologic și este, de asemenea, considerată una dintre instrumente eficiente de management al calitatii la etapa de control al calitatii produsului finit si analiza starii actuale a procesului tehnologic [A :3] .