Nucleul ( nucleul englezesc ) în statistică și econometrie se numește fereastra (funcția de greutate). statisticile bayesiene , neparametrice și teoria recunoașterii modelelor tratează termenul în mod diferit.
În statisticile neparametrice , un nucleu este o funcție de pondere utilizată în estimarea distribuțiilor și a parametrilor ( estimarea densității nucleului , regresia nucleului ). Kernel-urile sunt de asemenea aplicate în analiza seriilor de timp . Evaluarea nucleului necesită specificarea lățimii ferestrei.
O funcție integrabilă K cu valoare reală nenegativă se numește nucleu. În cele mai multe cazuri, este de dorit ca funcția să îndeplinească încă două cerințe:
Dacă funcția are prima proprietate, atunci rezultatul estimării densității nucleului va fi într-adevăr o densitate de probabilitate . A doua proprietate asigură că media distribuției este egală cu media eșantionului utilizat.
Dacă funcția K este un nucleu, atunci funcția K *( u ) = λ K (λ u ) pentru λ > 0 va fi și ea un nucleu. Acest rezultat vă permite să alegeți o scară care este potrivită pentru datele disponibile.
În practică, mai multe tipuri de sâmburi sunt comune: uniforme, triunghiulare, Epanechnikovo [1] , Gaussian și așa mai departe.
Mai jos este un tabel care listează nucleele utilizate în mod obișnuit. Dacă suportul nucleului K este mărginit, atunci pentru toate valorile lui u în afara suportului lui .
Funcții kernel, K ( u ) | Eficiența [2] față de nucleul Epanechnikov | ||||
---|---|---|---|---|---|
Uniformă |
Purtător: |
92,9% | |||
triunghiular |
Purtător: |
98,6% | |||
Epanechnikovo
(parabolic) |
Purtător: |
100% | |||
Bisquare |
Purtător: |
99,4% | |||
Tripătrat |
Purtător: |
98,7% | |||
Tricubic |
Purtător: |
99,8% | |||
gaussian | 95,1% | ||||
cosinus |
Purtător: |
99,9% | |||
Logistică | 88,7% | ||||
Sigmoid | 84,3% | ||||
Silverman [3] | nedeterminat |