Statistici (funcția de eșantionare)

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 28 noiembrie 2019; verificarea necesită 1 editare .

O statistică  este o funcție numerică măsurabilă a unui eșantion care nu depinde de parametrii necunoscuți ai distribuției elementelor eșantionului.

Definiție

Să fie dat un eșantion aleatoriu de observații . De regulă, deoarece vorbim despre probleme de statistică matematică , distribuția elementelor acestui eșantion nu este complet cunoscută de cercetător (de exemplu, conține parametri numerici necunoscuți).

O statistică este o funcție de eșantionare măsurabilă arbitrară care nu depinde de parametrii de distribuție necunoscuți.

Condiția de măsurare a statisticilor înseamnă că această funcție este o variabilă aleatorie , adică se determină probabilitățile de a se încadra în intervale și alte mulțimi Borel pe linie.

Cel mai semnificativ aspect al acestui concept, care îl deosebește de alte variabile aleatoare care depind de eșantion, este că această funcție nu depinde de parametri necunoscuți, adică cercetătorul poate, folosind datele de care dispune, să găsească valoarea lui această funcție și, prin urmare, se bazează pe această valoare a evaluării și pe alte concluzii statistice.

Exemplu

Să presupunem că există un eșantion numeric , ale cărui elemente au o distribuție normală . Să presupunem că valoarea parametrului ( așteptarea matematică ) este cunoscută, adică este un anumit număr, iar valoarea abaterii standard este necunoscută (și trebuie estimată). Următoarele statistici pot fi folosite pentru aceasta:

Cu toate acestea, dacă valoarea parametrului este, de asemenea, necunoscută, atunci funcția nu este o statistică. În acest caz, ea mai poate fi studiată teoretic (de exemplu, pentru a demonstra că așteptarea matematică este ), dar valoarea sa numerică nu poate fi calculată, deci nu poate fi folosită pentru a obține concluzii statistice directe. În acest caz, estimarea parametrului este construită într-un mod diferit (vezi mai jos).

Următoarele sunt exemple de unele statistici utilizate în mod obișnuit. Toți presupun că observațiile sunt numerice, .

În ultimii ani, statistica obiectelor de natură non-numerică a fost, de asemenea, dezvoltată în mod activ .

Statistici utilizate pentru estimarea momentelor (momentele eșantionului)

Factorul de asimetrie selectivă

Coeficient de asimetrie selectivă :

.

Dacă densitatea distribuției este simetrică, atunci . Dacă coada din stânga a distribuției este „mai grea”, atunci , dacă coada din dreapta este „mai grea”, atunci .

Factorul de asimetrie a eșantionului este utilizat pentru a testa distribuția pentru simetrie , precum și un test preliminar brut pentru normalitate . Vă permite să respingeți, dar nu vă permite să acceptați ipoteza normalității.

Coeficientul eșantionului de curtoză

Coeficientul eșantionului de curtoză :

.

Distribuția normală are curtoză zero: .

Dacă cozile distribuției sunt „mai ușoare” și vârful este „mai ascuțit” decât cel al unei distribuții normale, atunci .

Dacă cozile distribuției sunt „mai grele” și vârful este mai „aplatizat” decât cel al distribuției normale, atunci .

Coeficientul de eșantionare al curtozei este adesea folosit ca un test preliminar brut pentru normalitate . Vă permite să respingeți, dar nu vă permite să acceptați ipoteza normalității.

Statistici legate de distribuția empirică

Distribuția empirică a unei variabile aleatoare , construită dintr-un eșantion aleator , este o funcție:

.

La orice valoare fixă ​​poate fi considerată o statistică.

Statistici comenzi

Statisticile ordinale se bazează pe calculul seriei variaționale , care se obține din eșantionul original prin ordonarea elementelor sale în ordine crescătoare:

.

Valoarea se numește statistică de ordinul al treilea.

Statistici de rang

Valoarea se numește rangul elementului eșantion dacă .

O statistică de rang este orice statistică care este o funcție a rangurilor de elemente , nu a valorilor acestora . Trecerea de la valori la rangurile lor vă permite să construiți teste statistice neparametrice care nu se bazează pe ipoteze a priori despre funcția de distribuție a eșantionului. Ele au un domeniu de aplicare mult mai larg decât testele statistice parametrice .

Clasament mediu

Un analog al mediei eșantionului este rangul mediu:

Statistici de clasare liniară

Multe statistici de rang utilizate în practică aparțin familiei statisticilor de rang liniare sau abordează asimptotic pe cele liniare ca . Statisticile de rang liniar în cazul general au forma:

,

unde  este o matrice numerică dată arbitrară de dimensiune .

Literatură

Link -uri