Un eșantion sau un set de mostre este o parte a setului general de elemente care este acoperit de un experiment (observare, anchetă).
Caracteristicile eșantionului:
O secvență de variabile aleatoare independente care corespund tuturor rezultatelor posibile ale experimentelor statistice și care au aceeași lege de distribuție a probabilității cu o variabilă aleatoare se numește dimensiunea eșantionului generată de o variabilă aleatoare [1] . Dacă este o variabilă aleatorie discretă , atunci un eșantion de volum este orice submulțime de obiecte din populația generală de volum , aleasă cu probabilitate egală dintre toate astfel de submulțimi [1] .
Mărimea eșantionului este numărul de cazuri incluse în eșantion.
Eșantioanele pot fi împărțite condiționat în mari și mici, deoarece în statistica matematică sunt utilizate abordări diferite, în funcție de dimensiunea eșantionului. Se crede că eșantioanele mai mari de 30 pot fi clasificate ca mari [2] .
Când se compară două (sau mai multe) mostre, dependența lor este un parametru important. Dacă este posibil să se stabilească o pereche homomorfă (adică atunci când un caz din proba X corespunde unui singur caz din proba Y și invers) pentru fiecare caz în două eșantioane (și această bază de relație este importantă pentru trăsătură măsurate în probe), astfel de eșantioane se numesc dependente . Exemple de selecții dependente:
Dacă nu există o astfel de relație între eșantioane, atunci aceste eșantioane sunt considerate independente , de exemplu:
În consecință, eșantioanele dependente au întotdeauna aceeași dimensiune, în timp ce dimensiunea eșantioanelor independente poate diferi.
Eșantioanele sunt comparate folosind diverse criterii statistice :
Eșantionul poate fi considerat reprezentativ sau nereprezentator. Eșantionul va fi reprezentativ atunci când se examinează un grup mare de persoane, dacă în cadrul acestui grup există reprezentanți ai diferitelor subgrupuri, doar astfel se pot trage concluzii corecte.
În Statele Unite, unul dintre cele mai cunoscute exemple istorice de eșantionare nereprezentativă este cazul care a avut loc în timpul alegerilor prezidențiale din 1936 [3] . Litrery Digest, care a prezis cu succes evenimentele mai multor alegeri anterioare, și-a apreciat greșit previziunile trimițând zece milioane de buletine de vot abonaților săi, precum și persoanelor selectate din agendele telefonice ale întregii țări și persoanelor din listele de înmatriculare a mașinilor. În 25% din buletinele de vot returnate (aproape 2,5 milioane), voturile au fost distribuite după cum urmează:
După cum se știe, Roosevelt a câștigat alegerile reale cu peste 60% din voturi. Greșeala The Litreary Digest a fost următoarea: dorința de a crește reprezentativitatea eșantionului – pentru că știau că majoritatea abonaților lor se considerau republicani – au extins eșantionul cu persoane selectate din agende de telefon și liste de înregistrare. Cu toate acestea, ei nu au ținut cont de realitățile contemporane și, de fapt, au recrutat și mai mulți republicani: în timpul Marii Depresiuni , în cea mai mare parte clasa medie și superioară (adică majoritatea republicanilor, nu democrații) era cea care își permitea să dețină telefoane și mașini .
Există mai multe tipuri principale de plan de construire a grupului [4] :
Probele sunt împărțite în două tipuri:
Utilizarea unui astfel de eșantion se bazează pe ipoteza că fiecare respondent are șanse egale de a fi inclus în eșantion. Pe baza listei populației generale se întocmesc fișe cu numărul de respondenți. Ele sunt puse într-un pachet, amestecate și o carte este scoasă din ele la întâmplare, se notează un număr, apoi se returnează înapoi. În plus, procedura se repetă de câte ori avem nevoie de dimensiunea eșantionului. Minus: repetarea unităților de selecție.
Procedura de construire a unui eșantion aleator simplu include următorii pași:
1) este necesară obținerea unei liste complete a membrilor populației generale și numerotarea acestei liste. O astfel de listă, rechemare, se numește cadru de eșantionare;
2) determinați dimensiunea eșantionului așteptat, adică numărul așteptat de respondenți;
3) extrageți câte numere din tabelul de numere aleatoare avem nevoie de unități de probă. Dacă eșantionul ar trebui să includă 100 de persoane, 100 de numere aleatorii sunt luate din tabel. Aceste numere aleatorii pot fi generate de un program de calculator.
4) selectați din lista de bază acele observații ale căror numere corespund numerelor aleatoare scrise
1) este adesea dificil să se creeze un cadru de eșantionare care să permită o probă simplă aleatorie.
2) rezultatul aplicării unui eșantion aleator simplu poate fi o populație mare, sau o populație distribuită pe o zonă geografică mare, ceea ce crește semnificativ timpul și costul culegerii datelor.
3) rezultatele aplicării unui eșantion aleator simplu sunt adesea caracterizate de o acuratețe scăzută și o eroare standard mai mare decât rezultatele aplicării altor metode probabilistice.
4) ca urmare a aplicării SRS, se poate forma o probă nereprezentativă. Deși eșantioanele obținute prin selecție aleatorie simplă, în medie, reprezintă adecvat populația generală, unele dintre ele reprezintă extrem de incorect populația studiată. Probabilitatea acestui lucru este deosebit de mare cu o dimensiune mică a eșantionului.
Preluare simplă nonreplayProcedura de construire a eșantionului este aceeași, doar cărțile cu numerele respondenților nu sunt returnate înapoi în pachet.
Selecția într-un astfel de eșantion se efectuează nu după principiile hazardului, ci după criterii subiective - accesibilitate, tipicitate, reprezentare egală etc.
Selecția grupurilor pentru participarea lor la un experiment psihologic se realizează folosind diverse strategii care sunt necesare pentru a asigura cea mai înaltă conformitate cu valabilitatea internă și externă [5] .
Randomizarea sau selecția aleatorie este folosită pentru a crea eșantioane aleatoare simple. Utilizarea unui astfel de eșantion se bazează pe presupunerea că fiecare membru al populației este la fel de probabil să fie inclus în eșantion. De exemplu, pentru a face un eșantion aleatoriu de 100 de studenți universitari , puteți pune lucrări cu numele tuturor studenților universitari într-o pălărie și apoi puteți scoate 100 de bucăți de hârtie din ea - aceasta va fi o selecție aleatorie (Goodwin J., p. . 147)……
selecția în perechi este o strategie de construire a grupurilor de eșantion, în care grupurile de subiecți sunt alcătuite din subiecți echivalenti din punct de vedere al parametrilor laterali semnificativi pentru experiment. Această strategie este eficientă pentru experimentele care utilizează grupuri experimentale și de control cu cea mai bună opțiune - atragereaperechi de gemeni ( mono- și dizigoți ).
Selecția stratometrică - randomizare cu selecția straturilor (sau clusterelor ). Cu această metodă de eșantionare, populația generală este împărțită în grupuri (straturi) care au anumite caracteristici ( sex , vârstă , preferințe politice , educație , nivel de venit etc.), și sunt selectați subiecți cu caracteristicile corespunzătoare.
Modelare aproximativă - întocmirea de eșantioane limitate și generalizarea concluziilor despre acest eșantion la o populație mai mare. De exemplu, atunci când participă la un studiu al studenților din anul II , datele acestui studiu sunt extinse la „persoanele cu vârsta cuprinsă între 17 și 21 de ani”. Admisibilitatea unor astfel de generalizări este extrem de limitată.
Modelarea aproximativă este formarea unui model care, pentru o clasă clar definită de sisteme (procese), își descrie comportamentul (sau fenomenele dorite) cu o acuratețe acceptabilă.