Scară

O scară (scara de măsurare) este un sistem de semne pentru care este setat un afișaj ( operație de măsurare ), care asociază unul sau altul element (valoare) al scalei cu obiecte, situații, evenimente sau procese reale . Formal, o scară este un tuplu , ⟨ X , φ, Y ⟩, unde X este un set de obiecte reale, situații, evenimente sau procese, φ este o mapare, Y este un set de elemente (valori) ale unui sistem de semne [ 1] [2] .

Diverse tipuri de scale de măsurare sunt utilizate pe scară largă în activitatea umană teoretică și practică , în știință și tehnologie - inclusiv în multe domenii științifice umanitare, cum ar fi economie , psihometrie , sociologie și altele [3] [4] pentru reprezentarea simbolică ( formală ) a obiecte (evenimente), proprietățile (caracteristicile) și relațiile acestora.

Tipuri de scară

Scalele de măsurare sunt clasificate în funcție de tipurile de date măsurate, care determină relațiile permise pentru o scară dată, inclusiv cele care corespund transformărilor matematice ale valorilor scalei [2] [5] . Clasificarea la scară modernă a fost propusă în 1946 de Stanley Smith Stevens .

Scala de nume (nominal, clasificare) Folosit pentru a măsura valorile caracteristicilor calitative. Valoarea unei astfel de caracteristici este numele clasei de echivalență căreia îi aparține obiectul în cauză. Exemple de valori ale caracteristicilor calitative sunt numele de state, culori, mărci de mașini etc. Astfel de caracteristici satisfac axiomele identității:

Fie A = B , fie A ≠ B .
Dacă A = B , atunci B = A .
Dacă A = B și B = C , atunci A = C .

Cu un număr mare de clase, se folosesc scale de denumire ierarhice. Cele mai cunoscute exemple de astfel de scale sunt [6] scalele folosite pentru a clasifica animalele și plantele. Cu valorile măsurate în scara numelor, puteți efectua o singură operație - verificarea coincidenței sau nepotrivirii lor. Pe baza rezultatelor unei astfel de verificări, este posibilă calcularea suplimentară a frecvenţelor (probabilităţilor) de umplere pentru diferite clase, care pot fi utilizate pentru aplicarea diferitelor metode de analiză statistică [6] - testul de bunătate a potrivirii, testul Cramer pentru testarea ipotezei despre relația dintre caracteristicile calitative etc.

\chi ^{2}

Scară ordinală (sau rang) Include relații de identitate și ordine. Obiectele din această scară sunt clasate. Dar nu toate obiectele pot fi subordonate relației de ordine. De exemplu, nu se poate spune care este mai mare - un cerc sau un triunghi, dar se poate evidenția o proprietate comună în aceste obiecte - zonă și, astfel, devine mai ușor să stabilești relații ordinale. Pentru această scară este acceptabilă o transformare monotonă. O astfel de scară este aspră deoarece nu ține cont de diferența dintre obiectele de scară. Un exemplu de astfel de scală: scoruri de performanță (nesatisfăcător, satisfăcător, bun, excelent), scala Mohs . Scale ordinale folosite pentru a reprezenta proprietățile obiectelor care pot lua valori extreme, opuse se numesc scale bipolare . Astfel de proprietăți includ, de exemplu, conformitatea unui obiect cu un anumit scop: de la „nu corespunde complet” la „corespunde complet” și diferite grade de conformitate parțială. În acest caz, valorile extreme ale scalei sunt atribuite valorilor extreme, opuse ale proprietăților, cele intermediare sunt folosite pentru a reprezenta gradul diferit de conformitate a obiectului cu scopul. Scala de intervale (denumită în continuare scară de diferențe) Aici există o comparație cu standardul. Construcția unei astfel de scale permite ca majoritatea proprietăților sistemelor numerice existente să fie atribuite numerelor obținute pe baza unor aprecieri subiective. De exemplu, construirea unei scale de intervale pentru reacții. Pentru această scară, o transformare liniară este acceptabilă. Acest lucru vă permite să aduceți rezultatele testelor la scale comune și astfel să comparați indicatorii. Exemplu: scara Celsius. Originea este arbitrară, unitatea de măsură este setată. Transformările valide sunt schimbări. Exemplu: măsurarea timpului. Scară absolută (alias scară de raport) Aceasta este o scară de intervale, în care există o proprietate suplimentară - prezența naturală și neechivocă a unui punct zero. Exemplu: numărul de persoane din audiență. În scara rapoartelor funcționează raportul „de atâtea ori mai mult”. Este singura dintre cele patru scale care are zero absolut. Punctul zero caracterizează absența calității măsurabile. Această scară permite o transformare de similaritate (înmulțire printr-o constantă). Determinarea punctului zero este o sarcină dificilă pentru cercetarea psihologică, ceea ce impune o limitare a utilizării acestei scale. Cu ajutorul unor astfel de cântare se poate măsura masa, lungimea, rezistența, costul (prețul). Exemplu: Scara Kelvin (temperaturi măsurate de la zero absolut, cu unitatea de măsură aleasă cu acordul specialiștilor - kelvin).

Dintre scalele luate în considerare, primele două sunt nemetrice , iar restul sunt metrice .

Problema adecvării metodelor de prelucrare matematică a rezultatelor măsurătorilor este direct legată de problema tipului de scară. În cazul general, statisticile adecvate sunt cele care sunt invariante în raport cu transformările admisibile ale scalei de măsurare utilizate.

Tipuri de cântare și proprietățile lor conform clasificării lui Stanley Smith Stevens

		Scara nominală	scară ordinală	Scala intervalului	Scala de relații
Operatii logice/ matematice	× ÷	Nu	Nu	Nu	da
	+ −	Nu	Nu	da	da
	< >	Nu	da	da	da
	= ≠	da	da	da	da
Exemple ( variabile dihotomice și non- dihotomice )		Dihotomice: gen (masculin/feminin) Non-dihotomice: naționalitate (americană/chineză/etc.)	Dihotomice: stare de sănătate (sănătoasă/bolnavă), frumusețe (frumos/urât) Non-dihotomice: opinie (total de acord / mai degrabă de acord / destul de dezacord / total dezacord)	Data (din 1457 î.Hr. până în 2013 d.Hr.), latitudine (de la +90° la -90°), temperatura (de la 10 °C la 20 °C)	Vârsta (de la 0 la 99 de ani)
Măsura tendinței centrale		Modă	Median	In medie	medie geometrică
Metric sau nu		Nemetric (calitate)	Nemetric (calitate)	Metric (cantitativ)	Metric (cantitativ)

Critica tipologiei lui Stevens

Analizând diverse tipuri de scale, F.N.Ilyasov ajunge la concluzia că scalele nominale și intervalale sunt artefacte de cercetare [7][ clarifica ] .

Deși tipologia lui Stevens este încă aplicabilă pe scară largă, ea este încă obiectul criticii teoreticienilor, în special în cazul scalei nominale și ordinale. [opt]

Principalele puncte de critică ale scalei Stevenson:

Reducerea alegerii la doar acele metode statistice care „demonstrează invarianța adecvată pentru acest tip de scară” pare a fi periculoasă pentru analiza datelor în practică.
Taxonomia lui este prea strictă pentru a fi aplicată datelor reale.
Constrângerile Stevens duc adesea la degradarea datelor prin conversie în ranguri și recurgerea ulterioară inutilă la metode non-parametrice.

Lord[ ce? ] a criticat argumentele lui Stevens arătând că alegerea unor teste statistice valide pentru un anumit set de date nu depinde de problemele de reprezentare sau unicitate, ci depinde de semnificație. [9]

Baker, Hardik și Petrinovich, precum și Borgatta și Bornstedt, au subliniat că respectarea constrângerilor lui Stevens îi obligă adesea pe cercetători să recurgă la ordonarea în ordine a datelor și, prin urmare, să renunțe la utilizarea testelor parametrice. Argumentul lor a fost mai mult de natură ad-hoc și s-a încheiat cu o propunere de a folosi proceduri parametrice standard în loc să se implice în problema robusteței. [10] [11]

Guttmann a susținut în general că interpretarea statistică a datelor depinde de ce întrebare este adresată datelor și de ce dovezi suntem dispuși să acceptăm ca răspuns la această întrebare. El a definit această dovadă în ceea ce privește funcția de pierdere aleasă pentru a testa calitatea modelului. [12]

John Tukey a criticat, de asemenea, limitările lui Stevens ca fiind periculoase pentru o bună analiză statistică. La fel ca Lord și Guttman, Tukey a remarcat importanța semnificației datelor în determinarea atât a scalei, cât și a modului adecvat de analiză. Deoarece tipurile de scală Stevens sunt absolute, într-o situație în care, de exemplu, datele nu pot fi considerate complet interval, acestea ar trebui să fie declasate la ordinal.

Chiar și Stevens însuși a făcut o rezervă, remarcând: „De fapt, majoritatea scalelor utilizate pe scară largă și eficient de psihologi sunt scale de ordine. Statisticile obișnuite, inclusiv mediile și abaterile standard, nu trebuie folosite strict atunci când se lucrează cu aceste scale, dar o anumită justificare pragmatică poate fi dată unei astfel de utilizări neautorizate: în multe cazuri duce la rezultate fructuoase.

Duncan[ ce? ] (1986) s-a opus folosirii cuvântului „măsurare” în descrierea scalei nominale, dar Stevens (1975) a dat apoi propria sa definiție a „măsurării”, care sună ca „atribuirea unei trăsături conform unei anumite reguli. Singura regulă care nu poate fi folosită în aceste scopuri este atribuirea accidentală. Cu toate acestea, așa-numita „dimensiune nominală” include judecata de valoare a cercetătorului, iar posibilele transformări ale acestei dimensiuni sunt nesfârșite. Aceasta este una dintre remarcile făcute de Domnul în 1953 în articolul satiric Despre tratamentul statistic al numerelor de fotbal [13]

Utilizarea „mediei” ca măsură a tendinței centrale pentru tipul ordinal este încă controversată printre cei care acceptă tipologia lui Stevens. În ciuda acestui fapt, mulți oameni de știință comportamental folosesc media pentru datele ordinale. Justificarea obișnuită pentru aceasta este că tipul ordinal în științele comportamentale se află undeva între adevăratele tipuri ordinal și interval. Deși diferența de spațiere dintre două cifre ordinale nu este constantă, este adesea de aceeași ordine.

De exemplu, aplicarea modelelor de măsurare într-un context educațional arată că notele generale au o relație destul de liniară cu măsurătorile din intervalul de note. Astfel, unii susțin că atâta timp cât diferența de distanță între cifrele ordinale nu este foarte mare, statisticile scărilor de interval (de exemplu, „medie”) pot avea un rezultat semnificativ pentru scalele ordinale. Software-ul de analiză statistică (de exemplu SPSS ) solicită utilizatorului să specifice clasa de măsurare adecvată pentru fiecare variabilă. Acest lucru asigură că erorile neintenționate ale utilizatorului nu conduc la analize fără sens (exemplu: analiza corelației cu o variabilă nominală).

Thurstone[ ce? ] a făcut progrese în dezvoltarea unei rațiuni pentru derivarea unui tip de interval bazat pe legea judecății comparate . O aplicare comună a legii este procesul analitic al ierarhiei . Geogr Rasch a făcut progrese suplimentare prin dezvoltarea modelului probabilistic Rasch , care furnizează baza teoretică și raționamentul pentru obținerea măsurătorilor intervalului din numărătoarea de observații (de exemplu, scorurile totale pentru note).

În ciuda tuturor criticilor, într-o gamă largă de situații, experiența arată că aplicarea statisticilor interzise la date conduce la rezultate semnificative din punct de vedere științific, care sunt importante în luarea deciziilor și valoroase pentru cercetări ulterioare.

Alte tipologii propuse

Există și alte tipologii decât Stevens. De exemplu: Mostller Mosteller și Tukey (1977), Nelder (1990) au creat descrieri ale numărării continue, relațiilor continue și modelelor de date categoriale. Vezi și: Chrisman (1998), van den Berg (1991).

Tipologie de Mosteller și Tukey (1977)

Mostelleriar Tukey a observat că nivelul 4 nu este suficient și a propus următoarea împărțire: [14]

Nume
Judecăți de valoare (de exemplu, boboc, absolvent etc.)
Evaluări limitate la 0 și 1
Numărabile (numere întregi pozitive)
Naturale (numere reale pozitive)
Echilibrat (orice numere reale)

De exemplu, procentele (o variantă a fracțiilor în termeni de Mosteller-Tukey) nu se potrivesc cu teoria Stevens, deoarece nu există transformări complet valide. [opt]

Tipologia lui Crisman (1998)

Nicholas Crisman a propus o căutare extinsă a nivelului de dimensiune pentru a lua în considerare diferitele dimensiuni care nu corespund neapărat noțiunilor tradiționale de niveluri de dimensiune. Măsurătorile legate de interval și repetare (de exemplu, grade radiale pe un cerc, ore etc.), categorii de membru gradat și alte tipuri de măsurare nu se potrivesc cu munca inițială a lui Steven, ceea ce a dus la introducerea a șase noi niveluri de măsurare la cele zece existente. :

Evaluat
Calitatea de membru absolventă
ordinal
Interval
Interval logaritmic
Relație extinsă
Relația ciclică
Relație derivată
Socoteală
Absolut

Nivelurile extinse de măsurare sunt rareori utilizate în afara geografiei academice. [cincisprezece]

Tipuri de scară și „teoria operațională a măsurării” a lui Stevens

Teoria tipului de scară este un fel de „slujitor intelectual” al teoriei operaționale a măsurătorii a lui Stevens, care a devenit definitivă în psihologie și științe comportamentale , în ciuda criticilor lui Michell pentru că nu este în concordanță cu măsurătorile din științele naturii (Michell, 1999). De fapt, Teoria Măsurării Operaționale a fost o reacție la constatările unui comitet înființat de Asociația Britanică pentru Avansarea Științei în 1932 pentru a explora posibilitatea unei măsurări științifice veritabile în științele psihologice și comportamentale. Acest comitet, care a devenit cunoscut sub numele de „Comitetul Ferguson”, a publicat un raport final (Ferguson, et al., 1940, p. 245) în care scala de somn Stevens (Stevens & Davis, 1938) a fost ținta criticilor.

… orice lege menită să exprime o relație cantitativă între intensitatea unei senzații și intensitatea unui stimul este nu numai falsă, ci de fapt lipsită de sens până când noțiunea de adaos aplicată senzației capătă sens.

Deci, dacă scara de vis Stevens măsoară intensitatea senzațiilor unui public, trebuie să se producă dovezi că aceste senzații sunt atribute cantitative . Dovada necesară a fost prezența „structurilor aditive” - un concept dezvoltat de matematicianul german Otto Holder (Hölder, 1901). Cu fizicianul și teoreticianul măsurătorilor Norman Robert Campbell dominând discuția comitetului Ferguson, s-a stabilit că măsurătorile în științele sociale erau imposibile din cauza absenței operației de concatenare . Ulterior, această decizie a fost recunoscută ca incorectă după dezvoltarea teoriei măsurătorilor comune de către Debru, precum și în mod independent de către Luce și Tukey. Cu toate acestea, Stevens nu a vrut să introducă experimente suplimentare pentru a detecta structurile aditive, ci să invalideze în totalitate decizia comitetului Ferguson prin propunerea unei noi teorii de măsurare.

Pentru a-l parafraza pe N.R. Campbell (Final Report, p.340), se poate spune că măsurarea, în sensul cel mai larg, este definită ca atribuirea unor numere obiectelor și evenimentelor după o anumită regulă (Stevens, 1946, p.677).

Stevens a fost foarte influențat de ideile unui alt academic de la Harvard, câștigător al Premiului Nobel , fizicianul Percy Bridgman (1927), a cărui doctrină „operaționism” Stevens a folosit-o pentru a defini termenul „măsurare”. De exemplu, definiția lui Stevens folosește o bandă de măsurare care definește lungimea (obiectul de măsurare) ca măsurabil (deci cuantificabil). Criticii operaționalismului spun că acesta confundă relațiile dintre două obiecte sau evenimente cu proprietățile unuia dintre obiecte sau evenimente (Hardcastle, 1995; Michell, 1999; Moyer, 1981a, b; Rogers, 1989).

Teoreticianul canadian al măsurătorilor William Rozeboom (1966) a fost unul dintre primii critici care s-au pronunțat ferm împotriva teoriei lui Stevens despre tipurile de scară.

Tipul variabilei depinde de context

O altă problemă poate fi aceea că aceeași variabilă poate avea diferite tipuri de scale, în funcție de modul în care este măsurată și de scopul analizei. De exemplu, culoarea părului este de obicei considerată o variabilă nominală deoarece nu are o anumită ordine. [16] Cu toate acestea, este posibilă aranjarea culorilor într-o anumită ordine în mai multe moduri, inclusiv după nuanță, folosind colorimetria .

Utilizare în psihometrie

Folosind diverse scale, este posibil să se producă diverse măsurători psihologice [17] . Primele metode de măsurători psihologice au fost dezvoltate în psihofizică . Sarcina principală a psihofizicienilor a fost să determine modul în care parametrii fizici ai stimulării se corelează cu evaluările subiective ale senzațiilor corespunzătoare acestora. Cunoscând această legătură, se poate înțelege ce senzație corespunde unuia sau altuia semn. Funcția psihofizică stabilește o relație între valoarea numerică a scalei măsurării fizice a stimulului și valoarea numerică a răspunsului psihologic sau subiectiv la acest stimul.

Câteva scale comune

Scale de temperatură ale diferitelor țări și perioade (Celsius, Fahrenheit, Kelvin etc.)
scara Richter
Scala de viteză a vântului Beaufort
Scara Mohs - o scară pentru duritatea mineralelor
Paleta de culori, Atlas de culori

Vezi și

Note

↑ Zhuravlev Yu. I. , Ryazanov V. V., Senko O. V. „Recunoaștere”. Metode matematice. Sistem software. Aplicații practice. - M .: Fazis, 2006. - ISBN 5-7036-0108-8 .
↑ 1 2 Anfilatov V. S., Emelyanov A. A., Kukushkin A. A. Analiza sistemului în management. - M. : Finanţe şi statistică, 2002. - 368 p.
↑ Economics and Management - High Statistical Technologies .
↑ Metode statistice - Tehnologii statistice înalte .
↑ Peregudov F.I. , Tarasevich F.P. Introducere în analiza sistemului. - M . : Şcoala superioară, 1989. - 367 p.
↑ 1 2 Bakhrushin V. E. Metode de analiză a datelor. - Zaporizhzhya, KPU, 2011.
↑ Ilyasov F. N. Scale și specificul măsurării sociologice // Monitorizarea opiniei publice: schimbări economice și sociale. 2014. Nr 1. S. 3-16.
↑ 1 2 Velleman, Paul F.; Wilkinson, Leland. Tipologiile nominale, ordinale, de intervale și de raporturi sunt înșelătoare // The American Statistician : jurnal. - Asociaţia Americană de Statistică, 1993. - Vol. 47 . - P. 65-72 . - doi : 10.2307/2684788 . — .
↑ Scaling: a sourcebook for behavioral cientists (engleză) / Gary Maranell (ed.). — Tranzacția Aldine, [2007]. — ISBN 9780202361758 .
↑ Bela O. Baker, Curtis D. Hardyck, Lewis F. Petrinovici. Măsurătorile slabe vs. Statistici puternice: o critică empirică a interdicțiilor lui SS Stevens nn Statistici // Măsurare educațională și psihologică. — 1966-07-01. — Vol. 26 , iss. 2 . - P. 291-309 . — ISSN 0013-1644 . - doi : 10.1177/001316446602600204 .
↑ Edgar F. Borgatta, George W. Bohrnstedt. Nivel de măsurare: Din nou // Metode sociologice și cercetare. — 1980-11-01. — Vol. 9 , iss. 2 . - P. 147-160 . — ISSN 0049-1241 . - doi : 10.1177/004912418000900202 .
↑ Louis Guttman. What is Not What in Statistics (engleză) // Journal of the Royal Statistical Society. Seria D (Statisticianul). - 1977. - Vol. 26 , iss. 2 . - P. 81-107 . - doi : 10.2307/2987957 .
↑ Lord, Frederic M. On the Statistical Treatment of Football Numbers // American Psychologist : journal . - 1953. - Decembrie ( vol. 8 ). - P. 750-751 . doi : 10.1037 / h0063675 .
↑ Mosteller, Frederick. Analiza datelor și regresia: un al doilea curs de statistică . — Reading, Mass: Addison-Wesley Pub. Co, 1977. - ISBN 978-0201048544 .
↑ Wolman, Abel G. Măsurarea și semnificația în știința conservării (engleză) // Conservation biology : journal. — 2006.
↑ Care este diferența dintre variabilele categorice, ordinale și de interval? . Institutul pentru Cercetare și Educație Digitală . Universitatea din California, Los Angeles. Preluat: 7 februarie 2016. (nedefinit)
↑ Suppes P. , Zinnes D. Fundamentele teoriei măsurătorilor // Măsurători psihologice. M.: 1967. S. 9-110.

Literatură

Gusev A. N., Izmailov C. A., Mikhalevskaya M. B. Măsurători în psihologie. Practica psihologica generala . Seria „Practicum”. Numărul 2. - M . : Sens, 1987, - 280 p.
Kliger S. L., Kosolapov M. S., Tolstova Yu. N. Scaling în colectarea și analiza informațiilor sociologice . - M .: Știință. 1978. - 107 p.