Eșantionare (statistici matematice)

Eșantionarea este o denumire generalizată în statistica matematică pentru metodele de control al eșantionului inițial cu un scop de modelare cunoscut, care permit realizarea identificării structural-parametrice a celui mai bun model statistic al unui proces aleator ergodic staționar.

Descriere

Noutatea științifică a metodei de eșantionare constă în faptul că este o tehnică eficientă pentru legarea semantică logică a proprietăților statistice ale eșantionului și scopul modelării. În același timp, eșantionarea mărește dimensiunea spațiului de criterii și, în același timp, acționează ca un mijloc de rezolvare a problemei Pareto-optimalității prin separarea anumitor criterii și ierarhizarea acestora (un criteriu structural are un rang mai mare decât unul parametric). , deci aceste criterii nu intră în conflict). N. N. Chubukov dă următorul exemplu [1] . Fie ca procesul aleator să fie reprezentat printr-un eșantion de mărime : . Trei sarcini trebuie rezolvate:

  1. Rulați o prognoză condiționată pe termen lung pentru ;
  2. Rulați o prognoză condiționată pe termen scurt pentru ;
  3. Definiți o funcție pentru a restabili valoarea în orice punct din selecție.

Dacă adoptăm abordarea tradițională pentru modelare, axată pe unicitatea descrierii proprietăților statistice ale procesului, atunci rezultatul va fi trei funcții complet identice. Cert este că regula de calcul a criteriului de calitate al modelului nu a ținut cont de detalii esențiale: orizontul de prognoză, natura tendințelor statistice ale procesului aleatoriu reprezentat de datele eșantionului, iar specificul țintă a sarcinilor a fost complet. ignorat .

Principiul diversității

Calea de ieșire din această dificultate poate fi utilizarea principiului diversității în cadrul eșantionării , care este cunoscut și utilizat pentru a rezolva probleme de inginerie prin aplicarea metodei de validare încrucișată a datelor, de exemplu, analiza bootstrap [2] , metoda de contabilizarea de grup a argumentelor [3] , etc. Manifestarea principiului diversităţii în rezolvarea problemelor statistice este aceea că algoritmul răspunde la ignorarea proprietăţilor probabilistice ale datelor iniţiale cu o varietate de structuri de model generate, fiecare dintre acestea fiind supusă la încrucişare. -verificarea optimitatii dupa o anumita schema comuna tuturor modelelor.

Sarcini

Eșantionarea este o metodă modernă care poate fi practic utilă pentru rezolvarea problemelor de statistică matematică, inclusiv a problemelor inverse și prost puse [4] . Eșantionarea implementează principiul diversității și poate generaliza întreaga gamă de instrumente de analiză statistică bazate pe managementul datelor sursă. Eșantionarea este înțeleasă ca un set de tehnici de împărțire a eșantionului inițial în secțiuni de lucru și control conform regulilor care corespund scopurilor modelării. Pe secțiunile de lucru se calculează parametrii modelelor „concurente”, pe cele de control se evaluează capacitatea acestora de a restabili valori care nu au fost utilizate pentru calcularea parametrilor.

Eșantionarea metodic corect „ocolește” principalul obstacol care este prezent în mod obiectiv în problemele inverse. Motivul ei constă în imposibilitatea stabilirii unei relații matematice stricte între parametrul variabil și valoarea numerică a criteriului de optimitate a modelului. În același timp, eșantionarea transferă algoritmul de identificare structural-parametrică a modelului din categoria strict matematică în clasa euristică și îl face promițător pentru crearea de sisteme de inteligență artificială .

În raport cu exemplul de mai sus, primul caz  - extrapolare „lungă” în afara eșantionului, corespunde variantei de eșantionare cu excluderea ultimelor zece valori ale eșantionului la rând din calculul parametrilor modelului. Al zecelea număr va fi controlul. Subeșantionul de lucru va cuprinde toate valorile, cu excepția acestor zece. Apoi, prin enumerare alternativă, se determină cel mai bun model, care a prezis cel mai precis punctul de control. Prin schimbarea poziției eșantioanelor excluse, fără a încălca numărul și continuitatea acestora, se formează statistici reziduale care sunt aplicabile pentru a calcula criteriul și „tubul” de stabilitate statistică pentru evaluarea fiabilității rezultatului. Algoritmul, așa cum spune, „examinează” modelele prin extrapolare la o anumită adâncime și îl selectează pe cel care surprinde cel mai precis tendințele „lungi” care conțin informații despre valorile unui decalaj de zece eșantioane. În acest caz, modelele „short-shooting” vor fi discriminate.

A doua sarcină va corespunde eșantionării cu excluderea din calcule a unui punct de control, cu o combinație a numărului și ordinii valorilor anterioare luate în considerare pentru prognoză. În acest caz, modelele „de lungă durată” vor fi „suprimate”, iar modelele care oferă previziuni precise pe termen scurt, dimpotrivă, vor avea prioritate.

În a treia sarcină , se va justifica împărțirea probei în blocuri care se întrepătrund, atunci când valorile de control sunt „intercalate” între lucrători. Lungimea unor astfel de blocuri și adâncimea de întrepătrundere a acestora trebuie să țină cont de intervalele dintre punctele învecinate ale intervalului, de stabilitatea necesară și de acuratețea estimărilor. Astfel, a treia sarcină poate corespunde excluderii din calcule a fiecărui al treilea eșantion de eșantion și utilizării datelor excluse pentru control cu ​​o realocare ciclică a subprobelelor de control și de lucru.

Tipuri de eșantionare

Vezi și

Note

  1. Chubukov N. N. Algoritmizarea calibrărilor sistemelor mecatronice folosind eșantionarea // Mechatronika, avtomatizatsiya, upravlenie. 2013. Nr 7.
  2. Efron B. Metode netradiționale de analiză statistică multivariată: Sat. articole: Per. din engleză / Cuvânt înainte de Yu. P. Adler, Yu. A. Koshevnik. - M .: Finanţe şi statistică, 1988. - 263 p. bolnav.
  3. Ivakhnenko, 1971 .
  4. Tikhonov A.N., Arsenin V.Ya. Metode de rezolvare a problemelor prost puse. - M .: Nauka, 1979. - S. 283 p.

Literatură