În statistică , valoarea (valoarea) unei variabile este numită semnificativă din punct de vedere statistic , dacă probabilitatea apariției aleatorii a acestor valori sau chiar mai multe valori extreme este mică. Aici, extrema este înțeleasă ca gradul de abatere a statisticilor testului de la ipoteza nulă .
Se spune că o diferență este semnificativă din punct de vedere statistic dacă existența datelor disponibile (sau a datelor chiar mai extreme) ar fi puțin probabilă, presupunând că această diferență este absentă; această expresie nu înseamnă că această diferență ar trebui să fie mare, importantă sau semnificativă în sensul general al cuvântului.
Imaginea generală a problemei este următoarea: dat un eșantion dintr-un anumit spațiu de evenimente elementare (de exemplu, o listă de pacienți care au fost examinați pentru o anumită boală) și, eventual, valori pe acest eșantion ale unor variabile (funcții de , de exemplu, vârsta pacientului, intensitatea fumatului, numărul de ore de exerciții fizice etc.). Distribuția probabilității nu este cunoscută, dar, dimpotrivă, este obiectul principal de căutare aici.
Diferite ipoteze corespund diferitelor distribuții posibile de probabilitate pe . Sensul exact al termenului „ipoteză” este un set de afirmații care conține o descriere completă a unei distribuții de probabilitate .
Testarea ipotezei (specificarea distribuției de probabilitate ) este după cum urmează. Se alege un eveniment (numit test statistic ) care este (din anumite motive) „aproape inconsecvent” cu ipoteza , în sensul că probabilitatea condiționată a evenimentului (presupunând că ipoteza este adevărată) nu depășește ceva mic (comparativ cu unitate) număr , numit nivel de semnificație : . Apoi se efectuează experimentul. Dacă evenimentul are loc, atunci ipoteza este respinsă (se spune că există o abatere de la ipoteză la nivel de semnificație ). Altfel, ipoteza nu este respinsă (totuși, nicio metodă de statistică, nici măcar știința în general, nu poate „demonstra în mod concludent” ipoteza).
Astfel, nivelul de semnificație al unui test este probabilitatea de a respinge o ipoteză dacă aceasta este de fapt adevărată (o decizie cunoscută sub numele de eroare de tip I sau decizie fals pozitivă ).
Nivelurile de semnificație populare sunt 10%, 5%, 1% și 0,1%.
Diferite valori ale nivelului α au avantajele și dezavantajele lor. Nivelurile α mai mici oferă mai multă încredere că ipoteza alternativă deja stabilită este semnificativă, dar există un risc mai mare de a nu respinge o ipoteză falsă nulă (sau de respingere a unei alternative adevărate) ( eroare de tip II sau „ decizie fals negativă ”) și deci putere statistică mai mică . Alegerea nivelului α necesită inevitabil un compromis între semnificație și putere și, prin urmare, între probabilitățile de eroare de tip I și de tip II .
Când se folosesc teste de semnificație statistică, trebuie avut în vedere că testul nu oferă deloc temei pentru acceptarea ipotezei [1] .
![]() |
---|