Heteroskedasticitatea

Heteroscedasticitatea este un  concept utilizat în statistica aplicată (cel mai adesea în econometrie ), adică eterogenitatea observațiilor, exprimată într-o varianță non-identică (non-constant) a erorii aleatoare a unui model de regresie (econometric). Heteroscedasticitatea este opusul homoscedasticității , adică omogenitatea observațiilor, adică constanța varianței erorilor aleatoare ale modelului.

Prezența heteroschedasticității erorilor aleatoare duce la ineficiența estimărilor obținute prin metoda celor mai mici pătrate . În plus, în acest caz, estimarea clasică a matricei de covarianță a estimărilor parametrilor celor mai mici pătrate se dovedește a fi părtinitoare și insostenabilă . Prin urmare, concluziile statistice despre calitatea estimărilor obținute pot fi inadecvate. În acest sens, testarea modelelor de heteroscedasticitate este una dintre procedurile necesare pentru construirea modelelor de regresie.

Testarea heteroscedasticității

Ca o primă aproximare, prezența heteroscedasticității poate fi observată pe graficele reziduurilor de regresie (sau pătratele acestora) pentru unele variabile, pentru variabila dependentă estimată sau pentru numărul de observație. În aceste grafice, răspândirea punctelor se poate modifica în funcție de valoarea acestor variabile.

Pentru o verificare mai riguroasă, de exemplu, se folosesc testele statistice White , Goldfeld-Kuandt , Broish -Pagan , Park , Glaser , Spearman .

Evaluarea modelului sub heteroscedasticitate

Deoarece estimările celor mai mici pătrate ale parametrilor modelului rămân nepărtinitoare chiar și cu heteroscedasticitatea, atunci cu un număr suficient de observații, este posibil să se utilizeze cele mai mici pătrate obișnuite. Cu toate acestea, pentru inferențe statistice mai precise și corecte, este necesar să folosiți erori standard în forma lui White .

Modalități de reducere a heteroscedasticității

  1. Utilizarea celor mai mici pătrate ponderate (WLS) . În această metodă, fiecare observație este ponderată invers cu deviația standard estimată a erorii aleatoare din observația respectivă. Această abordare face posibilă ca erorile aleatoare ale modelului homoscedastice. În special, dacă se presupune că abaterea standard a erorilor este proporțională cu o anumită variabilă , atunci datele sunt împărțite la acea variabilă, inclusiv o constantă.
  2. Înlocuirea datelor originale cu derivatele sale, cum ar fi un logaritm, o modificare relativă sau o altă funcție neliniară. Această abordare este adesea folosită atunci când varianța erorii crește odată cu valoarea variabilei independente și duce la stabilizarea varianței pe o gamă mai largă de date de intrare.
  3. Determinarea „domeniilor de competență” ale modelelor în care varianța erorii este relativ stabilă și utilizarea unei combinații de modele. Astfel, fiecare model funcționează numai în domeniul său de competență, iar variația erorii nu depășește valoarea limită specificată. Această abordare este comună în domeniul recunoașterii modelelor, unde sunt adesea folosite modele complexe neliniare și euristici.

Exemplu

Să luăm în considerare, de exemplu, dependența profitului de mărimea activelor:

.

Cu toate acestea, cel mai probabil nu numai profitul depinde de active, ci și „fluctuația” profitului nu este aceeași pentru una sau alta cantitate de active. Adică, cel mai probabil, abaterea standard a erorii aleatoare a modelului ar trebui presupusă a fi proporțională cu valoarea activelor:

.

În acest caz, este mai rezonabil să luăm în considerare nu modelul original, ci următorul:

,

presupunând că erorile aleatoare sunt homoscedastice în acest model. Puteți utiliza acest model transformat direct sau puteți utiliza estimările parametrilor obținute ca estimări ale parametrilor modelului original (cel mai mici pătrate ponderate). Teoretic, estimările obținute în acest fel ar trebui să fie mai bune.

Vezi și

Literatură