Distributie normala

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 20 octombrie 2022; verificările necesită 2 modificări .
Distributie normala

Linia verde corespunde distribuției normale standardProbabilitate densitate

Culorile din acest grafic se potrivesc cu graficul de mai sus.funcția de distribuție
Desemnare
Opțiuni μ  - factor de deplasare ( real ) σ > 0  - factor de scară (real, strict pozitiv)
Purtător
Probabilitate densitate
funcția de distribuție
Valorea estimata
Median
Modă
Dispersia
Coeficient de asimetrie
Coeficientul de kurtoză
Entropia diferenţială
Funcția generatoare a momentelor
functie caracteristica

Distribuția normală [1] [2] , numită și distribuția Gauss sau Gauss - Laplace [3]  este o distribuție de probabilitate , care în cazul unidimensional este dată de o funcție de densitate de probabilitate , care coincide cu funcția Gauss :

, unde parametrul  este așteptarea matematică (valoarea medie), mediana și modul de distribuție, iar parametrul  este abaterea standard ,  este varianța distribuției .

Astfel, distribuția normală unidimensională este o familie de distribuții cu doi parametri care aparține clasei exponențiale de distribuții [4] . Cazul multivariat este descris în articolul „ Distribuție normală multivariată ”.

Distribuția normală standard este o distribuție normală cu medie și abatere standard

Informații generale

Dacă o mărime este suma mai multor cantități aleatoare slab interdependente, fiecare dintre acestea având o contribuție mică în raport cu suma totală, atunci distribuția centrată și normalizată a unei astfel de mărimi tinde către o distribuție normală cu un număr suficient de mare de termeni .

Aceasta rezultă din teorema limită centrală a teoriei probabilităților . În lumea din jurul nostru, există adesea cantități a căror valoare este determinată de o combinație de mulți factori independenți. Acest fapt, precum și faptul că distribuția era considerată tipică, obișnuită, a condus la faptul că la sfârșitul secolului al XIX-lea a început să fie folosit termenul de „distribuție normală”. Distribuția normală joacă un rol proeminent în multe domenii ale științei, cum ar fi statistica matematică și fizica statistică .

O variabilă aleatoare care are o distribuție normală se numește variabilă aleatoare normală sau gaussiană.

Definiții

Distribuție normală standard

Cel mai simplu caz al unei distribuții normale - distribuția normală standard  - este un caz special când și Densitatea sa de probabilitate este:

Factorul din expresie oferă condiția pentru normalizarea integralei [5] . Deoarece factorul din exponent oferă o dispersie egală cu unu, atunci abaterea standard este egală cu 1. Funcția este simetrică în punctul , valoarea sa în ea este maximă și egală cu punctele de inflexiune ale funcției: și

Gauss a numit distribuția normală standard cu care este:

Distribuție normală cu parametri

Fiecare distribuție normală este o variantă a distribuției normale standard al cărei interval este extins cu un factor (abatere standard) și reportat la (așteptare):

sunt parametri ai distribuției normale. Densitatea de probabilitate trebuie normalizată astfel încât integrala să fie egală cu 1.

Dacă  este o variabilă aleatorie normală standard, atunci valoarea va avea o distribuție normală cu așteptări matematice și abatere standard , Dimpotrivă, dacă  este o variabilă normală cu parametri și atunci va avea o distribuție normală standard.

Dacă deschidem parantezele în exponentul densității probabilității și luăm în considerare faptul că , atunci:

Astfel, densitatea de probabilitate a fiecărei distribuții normale este exponentul unei funcții pătratice :

Unde

De aici, se poate exprima media ca a și varianța ca Pentru distribuția normală standard și

Denumire

Densitatea de probabilitate a distribuției normale standard (cu medie zero și varianță unitară) este adesea notată cu litera greacă ( phi ) [6] . O formă alternativă a literei grecești phi este, de asemenea, destul de frecvent utilizată .

Distribuția normală este adesea notată cu sau [7] . Dacă variabila aleatoare este distribuită conform legii normale cu medie și variație, atunci scriem:

Funcția de distribuție

Funcția de distribuție a distribuției normale standard este de obicei notată cu o literă greacă mare ( phi ) și este o integrală:

Funcția de eroare (integrala de probabilitate) este asociată acesteia, dând probabilitatea ca o variabilă aleatoare normală cu media 0 și variația 1/2 să cadă în segment :

Aceste integrale nu sunt exprimate în funcții elementare și se numesc funcții speciale . Multe dintre aproximările lor numerice sunt cunoscute. Vezi mai jos .

Funcțiile sunt legate, în special, de relația:

.

O distribuție normală cu media densității și varianță are următoarea funcție de distribuție:

Puteți utiliza funcția  - va da probabilitatea ca valoarea variabilei aleatoare normale standard să depășească :

.

Graficul funcției de distribuție normală standard are o simetrie de rotație de două ori în jurul punctului (0; 1/2), adică integrala sa nedefinită este:

Funcția de distribuție a unei variabile aleatoare normale standard poate fi extinsă folosind metoda integrării pe părți dintr-o serie:

unde semnul înseamnă factorial dublu .

Extinderea asimptotică a funcției de distribuție pentru valori mari se poate face și prin integrare pe părți.

Abatere standard

Aproximativ 68% din valorile din distribuția normală sunt la o distanță de cel mult o abatere standard σ de la medie; aproximativ 95% din valori se află la o distanță de cel mult două abateri standard; iar 99,7% nu mai mult de trei. Acest fapt este un caz special al regulii 3 sigma pentru un eșantion normal.

Mai precis, probabilitatea de a obține un număr normal între și este:

Cu o precizie de 12 cifre semnificative, valorile pentru sunt date în tabelul [8] :

OEIS
unu 0,682689492137 0,317310507863
3.15148718753
A178647
2 0,954499736104 0,045500263896
21.9778945080
A110894
3 0,997300203937 0,002699796063
370,398347345
A270712
patru 0,999936657516 0,000063342484
15787.1927673
5 0,999999426697 0,000000573303
1744277.89362
6 0,999999998027 0,000000001973
506797345.897

Proprietăți

Momente

Momentele și momentele absolute ale unei variabile aleatoare se numesc așteptări matematice ale variabilelor aleatoare și, respectiv. Dacă așteptarea matematică este o variabilă aleatoare atunci acești parametri sunt numiți momente centrale . În cele mai multe cazuri, momentele pentru numere întregi prezintă interes.

Dacă are o distribuție normală, atunci are momente (finite) pentru toate cu partea reală mai mare decât −1. Pentru numerele întregi nenegative , momentele centrale sunt:

Iată  un număr natural, iar notația înseamnă factorialul dublu al numărului, adică (deoarece este impar în acest caz) produsul tuturor numerelor impare de la  1 la

Momentele centrale absolute pentru numerele întregi nenegative sunt:

Ultima formulă este valabilă și pentru arbitrare .

Transformată Fourier și funcție caracteristică

Transformarea Fourier a densității normale de probabilitate cu deviația standard medie este [9] :

unde este unitatea imaginară .

Dacă așteptarea , atunci primul factor este 1, iar transformata Fourier, până la o constantă, este densitatea normală de probabilitate pe intervale de frecvență, cu așteptarea egală cu 0 și abaterea standard . În special, distribuția normală standard este o funcție proprie a lui Fourier. transforma.

În teoria probabilității, transformata Fourier a densității de distribuție a unei variabile aleatoare reale este strâns legată de funcția caracteristică a acestei variabile, care este definită ca așteptarea matematică a și este o funcție a unei variabile reale (parametrul de frecvență al lui Fourier). transforma). Definiția poate fi extinsă la o variabilă complexă [10] . Raportul se scrie astfel:

Divizibilitate infinită

Distribuția normală este divizibilă la infinit .

Dacă variabilele aleatoare și sunt independente și au o distribuție normală cu medie și și varianțe și respectiv, atunci are și o distribuție normală cu medie și varianță

Aceasta implică faptul că o variabilă aleatorie normală poate fi reprezentată ca suma unui număr arbitrar de variabile aleatoare normale independente.

Entropia maximă

Distribuția normală are entropia diferențială maximă între toate distribuțiile continue a căror varianță nu depășește o valoare dată [11] [12] .

Regula trei sigma pentru o variabilă aleatorie gaussiană

Regula celor trei sigma ( ) - aproape toate valorile unei variabile aleatoare distribuite normal se află în intervalul:

unde  sunt așteptările matematice și parametrul unei variabile aleatoare normale.

Mai precis, cu aproximativ o probabilitate de 0,9973, valoarea unei variabile aleatoare distribuite normal se află în intervalul specificat.

Simularea variabilelor pseudo-aleatoare normale

În simulările pe calculator, în special atunci când se aplică metoda Monte Carlo , este de dorit să se utilizeze cantități distribuite conform legii normale. Mulți algoritmi dau valori normale standard, deoarece valoarea normală poate fi obținută ca:

unde Z este valoarea normală standard.

Algoritmii folosesc, de asemenea, diverse transformări ale mărimilor uniforme. Cele mai simple metode de modelare aproximativă se bazează pe teorema centrală a limitei . Dacă adăugăm un număr suficient de mare de mărimi independente distribuite identic cu o varianță finită , atunci suma va avea o distribuție apropiată de normală. De exemplu, dacă adăugați 100 de variabile aleatoare standard independente distribuite uniform , atunci distribuția sumei va fi aproximativ normală .

Pentru generarea programatică de variabile pseudo-aleatoare distribuite normal, este de preferat să folosiți transformarea Box-Muller . Vă permite să generați o valoare distribuită normal pe baza uneia distribuite uniform.

Există și algoritmul Ziggurat , care este chiar mai rapid decât transformarea Box-Muller. Cu toate acestea, este mai dificil de implementat, dar utilizarea sa este justificată în cazurile în care este necesară generarea unui număr foarte mare de numere aleatoare distribuite neuniform.

Distribuție normală în natură și aplicații

Distribuția normală se găsește adesea în natură. De exemplu, următoarele variabile aleatoare sunt bine modelate de distribuția normală:

  • abatere în timpul fotografierii;
  • erori de măsurare (cu toate acestea, erorile unor instrumente de măsură au o distribuție diferită);
  • unele caracteristici ale organismelor vii dintr-o populatie.

Această distribuție este atât de răspândită deoarece este o distribuție continuă infinit divizibilă cu varianță finită. Prin urmare, alții se apropie de el în limită, cum ar fi binom și Poisson . Această distribuție modelează multe procese fizice nedeterministe [13] .

Distribuția normală multivariată este utilizată în studiul variabilelor aleatoare multivariate (vectori aleatori). Unul dintre numeroasele exemple de astfel de aplicații este studiul parametrilor personalității umane în psihologie și psihiatrie .

Relația cu alte distribuții

  • Distribuția normală este o distribuție Pearson de tip XI [14] .
  • Raportul unei perechi de variabile aleatoare standard independente distribuite normal are o distribuție Cauchy [15] . Adică, dacă o variabilă aleatoare este un raport (unde și  sunt variabile aleatoare normale standard independente), atunci va avea o distribuție Cauchy.
  • Dacă  sunt variabile aleatoare normale standard independente împreună, adică, atunci variabila aleatoare are o distribuție chi-pătrat cu k  grade de libertate.
  • Dacă o variabilă aleatorie are o distribuție lognormală , atunci logaritmul ei natural are o distribuție normală. Adică dacă atunci Și invers, dacă atunci
  • Dacă variabile aleatoare independente distribuite normal cu așteptări și varianțe matematice, atunci media lor eșantionului este independentă de abaterea standard a eșantionului [16] , iar raportul dintre următoarele două variabile va avea o distribuție t cu grade de libertate:
  • Dacă variabile aleatoare normale standard independente, atunci raportul sumelor normalizate de pătrate va avea o distribuție Fisher cu ( ) grade de libertate [17] :
  • Raportul pătratelor a două variabile aleatoare normale standard are o distribuție Fisher cu grade de libertate

Istorie

Pentru prima dată, distribuția normală ca limită a distribuției binomiale la a apărut în 1738 în a doua ediție a lui De Moivre „Doctrina hazardului” [18] . Aceasta a fost prima dovadă a unui caz special al teoremei limitei centrale . În 1809, Gauss, în Teoria mișcării corpurilor cerești, a introdus această distribuție ca rezultând din măsurători repetate ale mișcării corpurilor cerești. Cu toate acestea, Gauss a derivat o formulă pentru variabile aleatoare reale din principiul maximizării densității comune a tuturor măsurătorilor într-un punct cu coordonatele egale cu media tuturor măsurătorilor. Acest principiu a fost ulterior criticat. În 1812, Laplace în teorema Moivre-Laplace a generalizat rezultatul lui Moivre pentru o distribuție binomială arbitrară, adică pentru sume de mărimi binare independente distribuite identic [3] .

Vezi și

Note

  1. Wentzel E. S. Teoria probabilității. - Ed. a X-a, stereotip .. - M . : Academia , 2005. - 576 p. — ISBN 5-7695-2311-5 .
  2. Probabilitatea Shiryaev A.N. — M .: Nauka, 1980.
  3. 1 2 Dicţionar enciclopedic matematic . - M .: Enciclopedia Sovietică , 1988. - S.  139 -140.
  4. Wasserman L. Toate statisticile . - New York, NY: Springer, 2004. - P.  142 . — 433 p. — ISBN 978-1-4419-2322-6 .
  5. Dovada, vezi integrala Gaussiană
  6. Halperin, Hartley & Hoel, 1965 , articolul 7.
  7. McPherson (1990 )
  8. Wolfram|Alpha: Computational Knowledge Engine . Wolframalpha.com . Preluat: 3 martie 2017.
  9. Bryc (1995 , p. 23)
  10. Bryc (1995 , p. 24)
  11. Coperta, Thomas M.; Thomas, Joy A. Elemente de teoria informației. - John Wiley and Sons , 2006. - P. 254.
  12. Park, Sung Y.; Bera, Anil K. Modelul de heteroskedasticitate condiționată autoregressiv de entropie maximă  //  Journal of Econometrics : jurnal. - Elsevier, 2009. - P. 219-230 . Arhivat din original pe 7 martie 2016.
  13. Taleb N. N. Black Swan. Sub semnul impredictibilității = The Black Swan: The Impact of the Highly Improbable. - Colibri, 2012. - 525 p. - ISBN 978-5-389-00573-0 .
  14. Korolyuk, 1985 , p. 135.
  15. Galkin V. M., Erofeeva L. N., Leshcheva S. V. Estimări ale parametrului de distribuție Cauchy // Proceedings of the Nizhny Novgorod State Technical University. R. E. Alekseeva . - 2014. - Nr. 2 (104). - S. 314-319. - UDC  513.015.2 .
  16. Lukacs, Eugene. O caracterizare a distribuției normale  //  Analele statisticii matematice : jurnal. - 1942. - Vol. 13 , nr. 1 . - P. 91-3 . — ISSN 0003-4851 . - doi : 10.1214/aoms/1177731647 . — .
  17. Lehmann, E. L. Testarea ipotezelor statistice . — al 2-lea. — Springer, 1997. - S.  199 . — ISBN 978-0-387-94919-2 .
  18. Doctrina șanselor; sau, o metodă de calcul a probabilității evenimentelor în joc, L., 1718, 1738, 1756; L., 1967 (ed. reprodusă); Miscellanea analytica de scriebus et quadraturis, L., 1730.

Literatură

  • Korolyuk V. S. , Portenko N. I. , Skorokhod A. V. , Turbin A. F. Manual de teorie a probabilității și statistică matematică. - M. : Nauka, 1985. - 640 p.
  • Halperin, Max; Hartley, Herman O.; Hoel, Paul G. Standarde recomandate pentru simboluri statistice și notație. Comitetul COPSS pentru simboluri și notație  //  Statisticianul american : jurnal. - 1965. - Vol. 19 , nr. 3 . - P. 12-14 . - doi : 10.2307/2681417 . — .
  • McPherson, Glen. Statistica în investigația științifică : baza, aplicarea și interpretarea acesteia  . - Springer-Verlag , 1990. - ISBN 978-0-387-97137-7 .
  • Bryc, Wlodzimierz. Distribuția normală: Caracterizări cu  aplicații . - Springer-Verlag , 1995. - ISBN 978-0-387-97990-8 .

Link -uri