Histograma (statistici)

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 27 aprilie 2016; verificările necesită 10 modificări .

O histogramă în statistica matematică  este una dintre metodele grafice pentru studierea seriei de distribuție a valorilor unei variabile aleatoare. [B:1]

Dintre metodele grafice de studiere a seriilor de distribuție sunt indicate următoarele [1] :

Poligoanele în trepte și poligoane de frecvență sunt numite în mod colectiv poligoane de distribuție . Graficul de dispersie, poligonul în trepte și poligonul de frecvență sunt indicate ca fiind cele mai convenabile. [unu]

Pentru cazul bidimensional, în loc de o serie de distribuție, se construiește un tabel de distribuție, iar construcția grafică corespunzătoare se numește prismogramă . [unu]

Definiție

Potrivit GOST

GOST R 50779.10-2000 a oferit următoarele definiții:

2.17 histograma
O reprezentare grafică a distribuției de frecvență pentru o caracteristică cantitativă, formată din dreptunghiuri învecinate ale căror baze sunt intervale de clasă și ale căror arii sunt proporționale cu frecvențele acestor clase

2.18 grafic cu bare
O reprezentare grafică a distribuției de frecvență pentru o variabilă aleatorie discretă, format dintr-un set de coloane de latime egala, ale caror inaltimi sunt proportionale cu frecventele[D:1]

Definiție alternativă

Să fie un eșantion dintr-o anumită distribuție . Să definim o partiție a liniei reale . Lăsa

este numărul de elemente de probă care se încadrează în intervalul al-lea. Apoi o funcție constantă pe bucăți , care are forma:

, se numește histogramă normalizată.[2]

Histograma unei distribuții perfect continue

Fie distribuția variabilelor aleatoare absolut continuă și dată de densitatea de probabilitate . Apoi

în probabilitate la . [3]

Procedura pentru construirea unei histograme

La desenarea după metoda dreptunghiurilor, axa orizontală este împărțită în segmente egale corespunzătoare rangurilor ; pe aceste segmente, ca si pe baze, se construiesc dreptunghiuri cu inaltimea proportionala cu frecventa unei descarcari date. [patru]

Să descriem această procedură mai detaliat. În primul rând, setul de valori pe care le poate lua elementul eșantion este împărțit în mai mulți biți (bină). Cel mai adesea, aceste intervale sunt luate la fel, dar aceasta nu este o cerință strictă. Aceste intervale sunt trasate pe axa orizontală, apoi se desenează un dreptunghi deasupra fiecăruia. Dacă toate intervalele au fost aceleași, atunci înălțimea fiecărui dreptunghi este proporțională cu numărul de elemente eșantion care se încadrează în intervalul corespunzător. Dacă intervalele sunt diferite, atunci înălțimea dreptunghiului este aleasă astfel încât aria lui să fie proporțională cu numărul de elemente eșantion care se încadrează în acest interval.

Pentru construirea unei histograme este esențial să alegeți partiția optimă, deoarece pe măsură ce intervalele cresc, detaliul estimării densității distribuției scade, iar pe măsură ce intervalele scad, acuratețea valorii sale scade. Pentru a selecta numărul optim de intervale , este adesea folosită regula Sturges .

,

unde este numărul total de observații ale mărimii, este logaritmul de bază 2 și este partea întreagă a .

De asemenea, se găsește adesea o regulă care estimează numărul optim de intervale ca rădăcină pătrată a numărului total de măsurători:

Utilizare

Reprezentarea seriei de distribuție într-o formă transformată este o condiție necesară la compararea acestor serii între ele [1] .

Studiul seriilor de distribuție este mult facilitat de utilizarea metodei grafice . La reprezentarea seriilor de distribuție, valorile descărcărilor sau valorile observate ale variabilei aleatoare sunt reprezentate grafic pe axa orizontală , iar pe axa verticală, respectiv, frecvențele de biți sau frecvențele observate [1] .

Construcția histogramelor este utilizată pentru a obține o estimare empirică a densității de distribuție a unei variabile aleatoare [5] .

În cea mai generală formă, una dintre cele mai importante sarcini este formulată astfel: la un nivel de semnificație dat, testați ipoteza că distribuția prezentată pe histogramă este monomodală [A: 1] .

Exemple de utilizare

Analiza histogramei este considerată în mod tradițional printre geologi ca o metodă clară și informativă pentru rezolvarea problemelor geologice, deoarece analiza histogramei permite testarea ipotezelor geologice formulate în limbajul statisticii [A: 1] .

În cardiologie, construirea și descrierea unei histograme este o metodă geometrică obligatorie pentru analiza variabilității ritmului cardiac , propusă de standardele [A: 2] [B: 2] din 1996 . Ca modalități suplimentare de a descrie histogramele ritmului cardiac, sunt utilizate metode de interpretare triunghiulară a acestora , cum ar fi indicele Sf. Gheorghe și indicele triunghiular [6] .

În producție, atunci când se analizează starea procesului tehnologic, construirea histogramelor este considerată o modalitate eficientă de a evalua situația și de a efectua o analiză în prima etapă a studierii stabilității procesului tehnologic și este, de asemenea, considerată una dintre instrumente eficiente de management al calitatii la etapa de control al calitatii produsului finit si analiza starii actuale a procesului tehnologic [A :3] .

Vezi și

Note

  1. 1 2 3 4 5 Mitropolsky, 1971 , § 2 Rânduri și tabele de distribuție, p. 20-43.
  2. O histogramă normalizată este o densitate de probabilitate. În special:
    • .
    • .
  3. Astfel, aria figurii de sub histograma normalizată, limitată de intervalul , se apropie de probabilitatea de a accepta valori în acest interval a oricăreia dintre variabilele aleatoare . Cu toate acestea, histograma normalizată nu converge punctual către densitatea distribuției teoretice a acestor variabile aleatoare.
  4. Mitropolsky, 1971 , p. 32.
  5. Pentru a construi o histogramă, intervalul de variație observat al unei variabile aleatoare este împărțit în mai multe intervale și se calculează proporția tuturor măsurătorilor care se încadrează în fiecare dintre intervale. Valoarea fiecărei acțiuni este luată ca o estimare a probabilității ca o variabilă aleatorie să se încadreze în intervalul corespunzător. Este greșit să vorbim despre densitatea de probabilitate în contextul unei histograme, deoarece histogramarea transformă o distribuție de orice fel într-una discretă (se ia în considerare evenimentul unei valori care se încadrează într-un anumit interval, al cărui număr este numărabil), iar pentru o variabilă aleatorie discretă nu există o funcție de densitate de probabilitate.
  6. Ryabykina, 1998 , § 3.6. Metode geometrice de analiză a ritmogramelor, p. 43-49.

Literatură

Cărți

  1. Mitropolsky A. K. . Tehnica calculelor statistice. - Ed. a II-a, revizuită. şi suplimentare .. - M . : Nauka, 1971. - 576 p. - (Biblioteca fizico-matematică a unui inginer). - 19 500 de exemplare.
  2. Ryabykina G.V. , Sobolev A.V. Variabilitatea ritmului cardiac. - M . : „Star'Ko”, 1998. - 200 p. — ISBN 5-85493-032-3 .

Articole

  1. 1 2 Tkachev Yu. A. Studiul histogramelor caracteristicilor geologice prin modelare computerizată  // Buletinul Institutului de Geologie al Centrului Științific Komi al Filialei Urale a Academiei Ruse de Științe: jurnal. - 2004. - Nr 2 . - S. 7-11 .
  2. Grupul de lucru al Societății Europene de Cardiologie și al Societății Nord-Americane de Stimulare și Electrofiziologie. Variabilitatea ritmului cardiac. Standarde de măsurare, interpretare fiziologică și utilizare clinică Buletin de aritmologie  : Jurnal  . - 1999. - Nr. 11 . - S. 53-78 .
  3. Abdullin I. A. , Beloborodova O. I. , Laptev N. I. , Moskvicheva E. L. , Goryainov A. D. Aplicarea metodelor statistice pentru evaluarea procesului tehnologic de producere a sarcinilor modelate  // Buletinul Universității Tehnologice Kazan: jurnal. - 2010. - Nr. 12 . - S. 477-482 .

Documente normative

  1. GOST R 50779.10-2000 (ISO 3534-1-93) Metode statistice. Probabilitatea și bazele statisticii. Termeni și definiții . docs.cntd.ru. Preluat la 27 mai 2020. Arhivat din original la 19 mai 2020.

Link -uri

  • Canva Online Bar Chart Builder
  • Instrument de graficare online pentru serviciul web ChartBlocks