O scară (scara de măsurare) este un sistem de semne pentru care este setat un afișaj ( operație de măsurare ), care asociază unul sau altul element (valoare) al scalei cu obiecte, situații, evenimente sau procese reale . Formal, o scară este un tuplu , ⟨ X , φ, Y ⟩, unde X este un set de obiecte reale, situații, evenimente sau procese, φ este o mapare, Y este un set de elemente (valori) ale unui sistem de semne [ 1] [2] .
Diverse tipuri de scale de măsurare sunt utilizate pe scară largă în activitatea umană teoretică și practică , în știință și tehnologie - inclusiv în multe domenii științifice umanitare, cum ar fi economie , psihometrie , sociologie și altele [3] [4] pentru reprezentarea simbolică ( formală ) a obiecte (evenimente), proprietățile (caracteristicile) și relațiile acestora.
Scalele de măsurare sunt clasificate în funcție de tipurile de date măsurate, care determină relațiile permise pentru o scară dată, inclusiv cele care corespund transformărilor matematice ale valorilor scalei [2] [5] . Clasificarea la scară modernă a fost propusă în 1946 de Stanley Smith Stevens .
Scala de nume (nominal, clasificare) Folosit pentru a măsura valorile caracteristicilor calitative. Valoarea unei astfel de caracteristici este numele clasei de echivalență căreia îi aparține obiectul în cauză. Exemple de valori ale caracteristicilor calitative sunt numele de state, culori, mărci de mașini etc. Astfel de caracteristici satisfac axiomele identității:Dintre scalele luate în considerare, primele două sunt nemetrice , iar restul sunt metrice .
Problema adecvării metodelor de prelucrare matematică a rezultatelor măsurătorilor este direct legată de problema tipului de scară. În cazul general, statisticile adecvate sunt cele care sunt invariante în raport cu transformările admisibile ale scalei de măsurare utilizate.
Tipuri de cântare și proprietățile lor conform clasificării lui Stanley Smith StevensScara nominală |
scară ordinală |
Scala intervalului |
Scala de relații | ||
---|---|---|---|---|---|
Operatii
logice/ matematice |
× ÷ |
Nu | Nu | Nu | da |
+ − |
Nu | Nu | da | da | |
< > |
Nu | da | da | da | |
= ≠ |
da | da | da | da | |
Exemple ( variabile dihotomice și non- dihotomice ) |
Dihotomice: gen (masculin/feminin) Non-dihotomice: |
Dihotomice: stare de sănătate (sănătoasă/bolnavă), frumusețe (frumos/urât) Non-dihotomice: |
Data (din 1457 î.Hr. până în 2013 d.Hr.), latitudine temperatura |
Vârsta (de la 0 la 99 de ani) | |
Măsura tendinței centrale | Modă | Median | In medie | medie geometrică | |
Metric sau nu | Nemetric (calitate) |
Nemetric (calitate) |
Metric (cantitativ) |
Metric (cantitativ) |
Analizând diverse tipuri de scale, F.N.Ilyasov ajunge la concluzia că scalele nominale și intervalale sunt artefacte de cercetare [7][ clarifica ] .
Deși tipologia lui Stevens este încă aplicabilă pe scară largă, ea este încă obiectul criticii teoreticienilor, în special în cazul scalei nominale și ordinale. [opt]
Principalele puncte de critică ale scalei Stevenson:
Lord[ ce? ] a criticat argumentele lui Stevens arătând că alegerea unor teste statistice valide pentru un anumit set de date nu depinde de problemele de reprezentare sau unicitate, ci depinde de semnificație. [9]
Baker, Hardik și Petrinovich, precum și Borgatta și Bornstedt, au subliniat că respectarea constrângerilor lui Stevens îi obligă adesea pe cercetători să recurgă la ordonarea în ordine a datelor și, prin urmare, să renunțe la utilizarea testelor parametrice. Argumentul lor a fost mai mult de natură ad-hoc și s-a încheiat cu o propunere de a folosi proceduri parametrice standard în loc să se implice în problema robusteței. [10] [11]
Guttmann a susținut în general că interpretarea statistică a datelor depinde de ce întrebare este adresată datelor și de ce dovezi suntem dispuși să acceptăm ca răspuns la această întrebare. El a definit această dovadă în ceea ce privește funcția de pierdere aleasă pentru a testa calitatea modelului. [12]
John Tukey a criticat, de asemenea, limitările lui Stevens ca fiind periculoase pentru o bună analiză statistică. La fel ca Lord și Guttman, Tukey a remarcat importanța semnificației datelor în determinarea atât a scalei, cât și a modului adecvat de analiză. Deoarece tipurile de scală Stevens sunt absolute, într-o situație în care, de exemplu, datele nu pot fi considerate complet interval, acestea ar trebui să fie declasate la ordinal.
Chiar și Stevens însuși a făcut o rezervă, remarcând: „De fapt, majoritatea scalelor utilizate pe scară largă și eficient de psihologi sunt scale de ordine. Statisticile obișnuite, inclusiv mediile și abaterile standard, nu trebuie folosite strict atunci când se lucrează cu aceste scale, dar o anumită justificare pragmatică poate fi dată unei astfel de utilizări neautorizate: în multe cazuri duce la rezultate fructuoase.
Duncan[ ce? ] (1986) s-a opus folosirii cuvântului „măsurare” în descrierea scalei nominale, dar Stevens (1975) a dat apoi propria sa definiție a „măsurării”, care sună ca „atribuirea unei trăsături conform unei anumite reguli. Singura regulă care nu poate fi folosită în aceste scopuri este atribuirea accidentală. Cu toate acestea, așa-numita „dimensiune nominală” include judecata de valoare a cercetătorului, iar posibilele transformări ale acestei dimensiuni sunt nesfârșite. Aceasta este una dintre remarcile făcute de Domnul în 1953 în articolul satiric Despre tratamentul statistic al numerelor de fotbal [13]
Utilizarea „mediei” ca măsură a tendinței centrale pentru tipul ordinal este încă controversată printre cei care acceptă tipologia lui Stevens. În ciuda acestui fapt, mulți oameni de știință comportamental folosesc media pentru datele ordinale. Justificarea obișnuită pentru aceasta este că tipul ordinal în științele comportamentale se află undeva între adevăratele tipuri ordinal și interval. Deși diferența de spațiere dintre două cifre ordinale nu este constantă, este adesea de aceeași ordine.
De exemplu, aplicarea modelelor de măsurare într-un context educațional arată că notele generale au o relație destul de liniară cu măsurătorile din intervalul de note. Astfel, unii susțin că atâta timp cât diferența de distanță între cifrele ordinale nu este foarte mare, statisticile scărilor de interval (de exemplu, „medie”) pot avea un rezultat semnificativ pentru scalele ordinale. Software-ul de analiză statistică (de exemplu SPSS ) solicită utilizatorului să specifice clasa de măsurare adecvată pentru fiecare variabilă. Acest lucru asigură că erorile neintenționate ale utilizatorului nu conduc la analize fără sens (exemplu: analiza corelației cu o variabilă nominală).
Thurstone[ ce? ] a făcut progrese în dezvoltarea unei rațiuni pentru derivarea unui tip de interval bazat pe legea judecății comparate . O aplicare comună a legii este procesul analitic al ierarhiei . Geogr Rasch a făcut progrese suplimentare prin dezvoltarea modelului probabilistic Rasch , care furnizează baza teoretică și raționamentul pentru obținerea măsurătorilor intervalului din numărătoarea de observații (de exemplu, scorurile totale pentru note).
În ciuda tuturor criticilor, într-o gamă largă de situații, experiența arată că aplicarea statisticilor interzise la date conduce la rezultate semnificative din punct de vedere științific, care sunt importante în luarea deciziilor și valoroase pentru cercetări ulterioare.
Există și alte tipologii decât Stevens. De exemplu: Mostller Mosteller și Tukey (1977), Nelder (1990) au creat descrieri ale numărării continue, relațiilor continue și modelelor de date categoriale. Vezi și: Chrisman (1998), van den Berg (1991).
Tipologie de Mosteller și Tukey (1977)Mostelleriar Tukey a observat că nivelul 4 nu este suficient și a propus următoarea împărțire: [14]
De exemplu, procentele (o variantă a fracțiilor în termeni de Mosteller-Tukey) nu se potrivesc cu teoria Stevens, deoarece nu există transformări complet valide. [opt]
Tipologia lui Crisman (1998)Nicholas Crisman a propus o căutare extinsă a nivelului de dimensiune pentru a lua în considerare diferitele dimensiuni care nu corespund neapărat noțiunilor tradiționale de niveluri de dimensiune. Măsurătorile legate de interval și repetare (de exemplu, grade radiale pe un cerc, ore etc.), categorii de membru gradat și alte tipuri de măsurare nu se potrivesc cu munca inițială a lui Steven, ceea ce a dus la introducerea a șase noi niveluri de măsurare la cele zece existente. :
Nivelurile extinse de măsurare sunt rareori utilizate în afara geografiei academice. [cincisprezece]
Teoria tipului de scară este un fel de „slujitor intelectual” al teoriei operaționale a măsurătorii a lui Stevens, care a devenit definitivă în psihologie și științe comportamentale , în ciuda criticilor lui Michell pentru că nu este în concordanță cu măsurătorile din științele naturii (Michell, 1999). De fapt, Teoria Măsurării Operaționale a fost o reacție la constatările unui comitet înființat de Asociația Britanică pentru Avansarea Științei în 1932 pentru a explora posibilitatea unei măsurări științifice veritabile în științele psihologice și comportamentale. Acest comitet, care a devenit cunoscut sub numele de „Comitetul Ferguson”, a publicat un raport final (Ferguson, et al., 1940, p. 245) în care scala de somn Stevens (Stevens & Davis, 1938) a fost ținta criticilor.
… orice lege menită să exprime o relație cantitativă între intensitatea unei senzații și intensitatea unui stimul este nu numai falsă, ci de fapt lipsită de sens până când noțiunea de adaos aplicată senzației capătă sens.
Deci, dacă scara de vis Stevens măsoară intensitatea senzațiilor unui public, trebuie să se producă dovezi că aceste senzații sunt atribute cantitative . Dovada necesară a fost prezența „structurilor aditive” - un concept dezvoltat de matematicianul german Otto Holder (Hölder, 1901). Cu fizicianul și teoreticianul măsurătorilor Norman Robert Campbell dominând discuția comitetului Ferguson, s-a stabilit că măsurătorile în științele sociale erau imposibile din cauza absenței operației de concatenare . Ulterior, această decizie a fost recunoscută ca incorectă după dezvoltarea teoriei măsurătorilor comune de către Debru, precum și în mod independent de către Luce și Tukey. Cu toate acestea, Stevens nu a vrut să introducă experimente suplimentare pentru a detecta structurile aditive, ci să invalideze în totalitate decizia comitetului Ferguson prin propunerea unei noi teorii de măsurare.
Pentru a-l parafraza pe N.R. Campbell (Final Report, p.340), se poate spune că măsurarea, în sensul cel mai larg, este definită ca atribuirea unor numere obiectelor și evenimentelor după o anumită regulă (Stevens, 1946, p.677).
Stevens a fost foarte influențat de ideile unui alt academic de la Harvard, câștigător al Premiului Nobel , fizicianul Percy Bridgman (1927), a cărui doctrină „operaționism” Stevens a folosit-o pentru a defini termenul „măsurare”. De exemplu, definiția lui Stevens folosește o bandă de măsurare care definește lungimea (obiectul de măsurare) ca măsurabil (deci cuantificabil). Criticii operaționalismului spun că acesta confundă relațiile dintre două obiecte sau evenimente cu proprietățile unuia dintre obiecte sau evenimente (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).
Teoreticianul canadian al măsurătorilor William Rozeboom (1966) a fost unul dintre primii critici care s-au pronunțat ferm împotriva teoriei lui Stevens despre tipurile de scară.
Tipul variabilei depinde de contextO altă problemă poate fi aceea că aceeași variabilă poate avea diferite tipuri de scale, în funcție de modul în care este măsurată și de scopul analizei. De exemplu, culoarea părului este de obicei considerată o variabilă nominală deoarece nu are o anumită ordine. [16] Cu toate acestea, este posibilă aranjarea culorilor într-o anumită ordine în mai multe moduri, inclusiv după nuanță, folosind colorimetria .
Folosind diverse scale, este posibil să se producă diverse măsurători psihologice [17] . Primele metode de măsurători psihologice au fost dezvoltate în psihofizică . Sarcina principală a psihofizicienilor a fost să determine modul în care parametrii fizici ai stimulării se corelează cu evaluările subiective ale senzațiilor corespunzătoare acestora. Cunoscând această legătură, se poate înțelege ce senzație corespunde unuia sau altuia semn. Funcția psihofizică stabilește o relație între valoarea numerică a scalei măsurării fizice a stimulului și valoarea numerică a răspunsului psihologic sau subiectiv la acest stimul.