Statisticile descriptive

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 19 octombrie 2017; verificările necesită 16 modificări .

Statistica descriptivă sau statistica descriptivă ( ing.  statistică descriptivă ) se ocupă de prelucrarea datelor empirice, sistematizarea acestora, prezentarea vizuală sub formă de grafice și tabele, precum și descrierea cantitativă a acestora prin principalii indicatori statistici.

Contrastată cu inferența statistică în sensul că nu trage concluzii despre populația generală pe baza rezultatelor studiului de cazuri speciale. Inferența statistică, pe de altă parte, presupune că proprietățile și modelele identificate în studiul obiectelor eșantionului sunt, de asemenea, inerente populației generale.

Metode de agregare a datelor

Statistica descriptivă utilizează trei metode principale de agregare a datelor :

  1. Vedere de masă
  2. Imagine grafică
  3. Calculul indicatorilor statistici

Vizualizare tabel

Tabel statistic  - un sistem de rânduri și coloane în care informațiile statistice despre fenomenele socio-economice sunt prezentate într-o anumită secvență.

Rezumat statistici

Există două forme principale de descriere a unei variabile aleatoare: funcția de distribuție și densitatea de probabilitate (una este diferențială, cealaltă este integrală).

Statisticile rezumate sunt descriptori suplimentari sau alternativi ai histogramelor și distribuțiilor cumulative.

Caracteristicile statistice sunt valori rezumative care sunt calculate dintr-un eșantion de observații, care este de obicei, dar nu neapărat, o estimare a unui parametru al populației.

În general, statisticile rezumative se împart în trei categorii:

  1. măsuri de locație sau centralitate (dacă distribuția este simetrică, toate cele trei caracteristici sunt egale între ele)
    1. Rău
    2. Valorea estimata
    3. Median (nu se supune „outlierilor”, instrument pentru a scăpa de „outliers”)
    4. Modă
  1. măsuri de împrăștiere sau dispersie/localizare
    1. Varianța unei variabile aleatoare este pătratul mediu al mediei, deoarece măsura pătratică este cea mai puțin sigură (atât media nu este o caracteristică stabilă, cât și varianța, „valorile aberante afectează” varianța)
    2. Abaterea standard (aproape egală cu dispersia)
    3. Minimum , Maximum (valori extreme)
    4. Gama interquantile
    5. Variație de interval
    6. Interval
    7. Interval de încredere
  1. masuri de forma
    1. Coeficient de asimetrie
    2. Factorul de deformare

Distribuții discrete și continue

Distribuția poate fi atât discretă, cât și continuă. În cazul unei distribuții discrete, aceasta este o astfel de distribuție atunci când probabilitatea fiecăreia dintre valorile variabilei aleatoare este aceeași. Dacă există N număr de valori posibile.

Un exemplu de modelare uniformă a distribuției. Stăm la stația de autobuz, există un interval de trafic de 10 minute. În fiecare moment aleatoriu (când ajungem la o oprire) probabilitatea ca autobuzul să meargă în decurs de 1 minut este de 1/10. Care este probabilitatea ca autobuzul să plece în 4 minute? Exact la fel - 1/10. Pentru a seta o variabilă aleatorie, trebuie să setați densitatea distribuției probabilității pe un anumit segment.

Vezi și

Literatură

Link -uri