Alegerea unui model statistic

Selecția modelului  este sarcina de a selecta un model statistic dintr-un set de modele candidate având în vedere datele disponibile. În cel mai simplu caz, se ia în considerare un set de date existent. Cu toate acestea, sarcina poate implica proiectarea de experimente , astfel încât colectarea datelor este legată de sarcina de selecție a modelului. Având în vedere candidați model cu aceeași putere predictivă sau explicativă, cel mai simplu model este probabil să fie cea mai bună alegere ( brizorul lui Occam ).

Konishi și Kitagawa [1] afirmă: „Majoritatea problemelor de inferență statistică pot fi considerate probleme legate de modelarea statistică”. În același timp, Cox [2] a spus: „Modul în care se realizează traducerea de la problema subiectului la modelul statistic este partea cea mai critică a analizei”.

Selecția modelului se poate referi și la sarcina de a selecta mai multe modele reprezentative dintr-un set mare de modele de calcul în scopul luării deciziilor sau al optimizării în condiții de incertitudine.

Introducere

În cele mai simple forme ale sale, selecția modelului este una dintre sarcinile fundamentale ale cercetării științifice . Definiția unui principiu care explică un set de observații este adesea legată direct de un model matematic pentru prezicerea acestor observații. De exemplu, când Galileo și-a efectuat experimentele cu un plan înclinat , el a demonstrat că mișcarea mingii urmează parabola prezisă în modelul său.

Cu numărul infinit de mecanisme și procese posibile pe care le pot oferi datele, cum poate cineva să înceapă chiar să aleagă cel mai bun model? Abordarea matematică ia de obicei o decizie între un set de candidați model. Acest set trebuie ales de cercetător. Modele simple precum polinoamele sunt adesea folosite , cel puțin la început. Burnham și Andersen [3] subliniază în cartea lor importanța alegerii modelelor bazate pe principii științifice, cum ar fi înțelegerea proceselor sau mecanismelor fenomenologice (de exemplu, reacțiile chimice) pentru date.

Odată ce un set de candidați model a fost selectat, analiza statistică permite selectarea celor mai bune dintre aceste modele. Ce înseamnă cel mai bine cuvântul este o întrebare discutabilă. O tehnică bună de selecție a modelului va echilibra între adecvarea modelului și simplitate. Modelele mai complexe pot fi capabile să se potrivească mai bine cu datele (de exemplu, un polinom de gradul cinci poate reprezenta exact șase puncte), dar parametrii suplimentari pot să nu fie utili (poate că cele șase puncte sunt de fapt distribuite aleatoriu de-a lungul unei linii drepte). Potrivirea unui model este de obicei determinată folosind , sau o aproximare a raportului de probabilitate , rezultând un test chi-pătrat . Complexitatea este în general măsurată prin numărarea numărului de parametri ai modelului .

Tehnicile de selecție a modelului pot fi considerate ca estimări ale unei cantități fizice, cum ar fi probabilitatea ca un model să producă datele disponibile. Prejudecățile și varianța sunt indicatori importanți ai calității unui predictor. Adesea este luat în considerare și un indicator de performanță .

Un exemplu standard de selecție a modelului este potrivirea curbei , unde, având în vedere un set de puncte și alte informații generale (de exemplu, când punctele sunt rezultatul unui eșantion de variabile aleatoare independente ), trebuie să selectăm o curbă care descrie funcția care generează punctele.

Metode de selectare a unui set de candidați într-un model

Criterii

Dacă ne restrângem în prealabil să luăm în considerare doar modele autoregresive (AR), adică presupunem că procesul Xt urmează modelul AR(k) cu o ordine adevărată necunoscută k, atunci mult timp k a fost folosit pentru a determina k în astfel de situații [4]

Mai preferat este cel utilizat în mod obișnuit în prezent [4]

Ceva mai târziu s-a sugerat [4]

Folosit frecvent

De asemenea, sunt utilizate următoarele criterii

Vezi și

Note

  1. Konishi, Kitagawa, 2008 , p. 75.
  2. Cox, 2006 , p. 197.
  3. Burnham, Anderson, 2002 .
  4. 1 2 3 4 Criterii de informare . Consultat la 30 decembrie 2018. Arhivat din original la 14 aprilie 2018.
  5. Nalbe, 1973 , p. 661-675.

Literatură