Mediana (din latină mediāna „mijloc”) sau valoarea mijlocie a unui set de numere - numărul care se află în mijlocul acestui set, dacă este sortat în ordine crescătoare, adică un astfel de număr încât jumătate din elementele setului nu este mai mic decât acesta, iar cealaltă jumătate nu este mai mult. O altă definiție echivalentă [1] : mediana unei mulțimi de numere este un număr, suma distanțelor (sau, mai strict, a modulelor ) de la care la toate numerele din mulțime este minimă. Această definiție se generalizează în mod natural la seturi de date multivariate și se numește mediana 1 .
De exemplu, mediana mulțimii {11, 9, 3, 5, 5} este numărul 5, deoarece se află în mijlocul acestei mulțimi după ordonarea sa: {3, 5, 5, 9, 11}. Dacă eșantionul are un număr par de elemente, mediana poate să nu fie determinată în mod unic: atunci, pentru datele numerice, se utilizează cel mai des jumătatea sumei a două valori adiacente (adică mediana mulțimii {1, 3) , 5, 7} este luat egal cu 4), vezi mai jos pentru detalii . În statisticile matematice , mediana poate fi folosită ca una dintre caracteristicile unui eșantion sau al unui set de numere.
Mediana variabilei aleatoare este, de asemenea, definită : în acest caz, este definită ca numărul care traversează distribuția. Aproximativ vorbind, mediana unei variabile aleatoare este un număr astfel încât probabilitatea de a obține valoarea variabilei aleatoare în dreapta acesteia este egală cu probabilitatea de a obține valoarea variabilei aleatoare în stânga acesteia (și ei sunt ambele egale cu 1/2), o definiție mai precisă este dată mai jos .
Mediana se poate spune, de asemenea, că este a 50 -a percentila , 0,5 cuantila sau a doua cuartilă a unui eșantion sau distribuție.
Dacă distribuția este continuă, atunci mediana este una dintre soluțiile ecuației
,unde este funcția de distribuție a variabilei aleatoare asociată cu densitatea distribuției ca
.Dacă distribuția este o funcție continuă crescătoare , atunci soluția ecuației este unică. Dacă distribuția are discontinuități, atunci mediana poate coincide cu valoarea minimă sau maximă (extremă) posibilă a variabilei aleatoare, ceea ce contrazice înțelegerea „geometrică” a acestui termen.
Mediana este o caracteristică importantă a distribuției unei variabile aleatoare și, ca și așteptarea matematică , poate fi folosită pentru a centra distribuția. Deoarece estimările medianei sunt mai robuste , estimarea acesteia poate fi mai preferabilă pentru distribuțiile cu așa-numitele. cozi grele . Cu toate acestea, avantajele estimării medianei față de așteptările matematice pot fi discutate numai dacă aceste caracteristici ale distribuției coincid, în special, pentru funcțiile de densitate de probabilitate simetrice.
Mediana este determinată pentru toate distribuțiile și, în caz de ambiguitate, este extinsă în mod natural, în timp ce așteptarea matematică poate să nu fie definită (de exemplu, pentru distribuția Cauchy ).
Luați în considerare situația financiară a 19 oameni săraci, dintre care fiecare are doar 5 ₽ și a unui milionar, care are literalmente 1 milion ₽. Apoi, în total, primesc 1.000.095 ₽ . Dacă banii sunt împărțiți în părți egale de 20 de persoane, obțineți 50.004,75 ₽ . Aceasta va fi media aritmetică a sumei de bani pe care o aveau toate cele 20 de persoane din acea cameră.
Mediana va fi egală cu 5 ₽ (suma „distanței” de la această valoare la starea fiecăruia dintre persoanele luate în considerare este minimă). Acest lucru poate fi interpretat după cum urmează: „împărțind” toate persoanele luate în considerare în două grupuri egale de 10 persoane, obținem că în primul grup toată lumea are nu mai mult de 5 ₽, în timp ce în al doilea - nu mai puțin de 5 ₽.
Din acest exemplu, reiese că, aproximativ vorbind, este cel mai corect să folosiți mediana ca stare „de mijloc”, dar media aritmetică, dimpotrivă, depășește semnificativ suma de numerar disponibilă pentru o persoană aleatorie din eșantion. .
Schimbările de dinamică sunt, de asemenea, diferite pentru media aritmetică cu o mediană, de exemplu, în exemplul de mai sus, dacă un milionar va avea 1,5 milioane de ruble (+50%), iar restul va avea 6 ruble (+20%), atunci media aritmetică a eșantionului va fi egală cu 75.005,70 ₽ , adică s-ar părea că toată lumea ar fi crescut uniform cu 50%, în timp ce mediana va deveni egală cu 6 ₽ (+20%).
Dacă există un număr par de cazuri și două medii diferă, atunci, prin definiție, orice număr dintre ele poate servi drept mediană (de exemplu, în eșantionul {1, 3, 5, 7}, orice număr din intervalul (3.5) poate servi drept mediană) . În practică, în acest caz, se utilizează cel mai des media aritmetică a două valori medii (în exemplul de mai sus, acest număr este (3+5)/2=4). Pentru mostrele cu un număr par de elemente, puteți introduce și conceptul de „mediană inferioară” (element cu numărul n/2 într-o serie ordonată de elemente; în exemplul de mai sus acest număr este 3) și „mediană superioară” (element cu număr (n + 2) / 2 ; în exemplul de mai sus este numărul 5) [2] . Aceste concepte sunt definite nu numai pentru date numerice, ci și pentru orice scară ordinală .
Dicționare și enciclopedii |
---|
Rău | |
---|---|
Matematica | Puterea medie ( ponderată ) medie armonică ponderat medie geometrică ponderat In medie ponderat rădăcină medie pătrată Cubic mediu medie mobilă Media aritmetică-geometrică Funcție medie Kolmogorov înseamnă |
Geometrie | |
Teoria probabilității și statistica matematică | |
Tehnologia de informație | |
Teoreme | |
Alte |