Cum să minți cu statisticile
Cum să minți cu statisticile |
Autor |
Darell Huff |
Limba originală |
Engleză |
Original publicat |
1954 |
Decor |
Irving Geis |
Editor |
W. W. Norton & Company Inc. |
Pagini |
142 |
ISBN |
0-393-31072-8 |
Cum să minți cu statisticile este o carte scrisă de Darell Huff .în 1954. Ea vorbește despre diferitele moduri în care statisticile pot fi folosite greșit pentru a înșela publicul și pentru a le manipula opiniile. Sunt luate în considerare multe exemple specifice, în principal din viața americană (reclamă, politică, propagandă și agitație).
Prima epigrafă a cărții este un citat din contele Beaconsfield (B. Disraeli) despre statistică: „Există trei tipuri de minciuni: minciuni, minciuni flagrante și statistici”.
Cartea se adresează cititorului nespecialist și este prevăzută cu ilustrații vii. Materialul este prezentat viu și într-o formă accesibilă, ceea ce a asigurat popularitatea ridicată a cărții - este una dintre publicațiile de statistică cu cea mai mare circulație din a doua jumătate a secolului XX [1] .
Cuprins
Eșantionul este în mod inerent părtinitor
O explicație a ce este eșantionarea , modul în care intervievatorii selectează în mod inconștient persoanele intervievate și le influențează răspunsurile.
O medie bine aleasă
Sunt luate în considerare tipurile de medie:
Exemplele arată cum alegerea tipului de valoare medie afectează valoarea acestuia pentru aceleași eșantioane. Se atrage atenția asupra posibilității de a manipula un cititor nepregătit prin alegerea unui tip de medie „convenient” (pentru manipulator).
Nuanțe care sunt modest tăcute
În acest capitol, autorul ia în considerare nuanțe importante ale cercetării statistice care sunt adesea omise în mod intenționat sau inconștient în articolele destinate publicului larg.
Se explică importanța dimensiunii eșantionului și relația acestuia cu tipul de populație. Sunt date exemple de manipulări ale dimensiunii eșantionului:
- Testarea eficacității pastei de dinți. Sunt efectuate teste de laborator privind efectul utilizării pastei de dinți pe șase subiecți. Uneori se realizează o serie de astfel de studii, iar studiul care a arătat un rezultat benefic pentru client (producător de pastă) este folosit în campaniile publicitare.
- Test de vaccin antipolio. 450 de copii au fost vaccinați, 680 nu au fost vaccinați (grupul de control). La scurt timp după aceea, în zonă a izbucnit o epidemie; copiii vaccinați nu au avut niciun caz de infecție cu poliomielita. Nici unul dintre membrii grupului de control nu a făcut-o. Experimentul a fost făcut inutil de la bun început din cauza alegerii greșite a numărului de participanți, deoarece nu pot fi așteptate mai mult de două cazuri de infecție într-un grup de această dimensiune.
Sunt introduse concepte:
Pe exemplul scalei de dezvoltare Hesselvorbește despre pericolul de a percepe o evaluare punctuală (în afara intervalului) a valorii medii - părinții încep să intre în panică dacă copilul lor nu îndeplinește norma (valoarea medie).
Se atrage atenția asupra importanței formulării în articolele bazate pe statistici. Ca exemplu, luați în considerare declarația companiilor de furnizare a energiei electrice (1948): „Puterea electrică este disponibilă pentru mai mult de 3/4 din fermele din Statele Unite”. Cuvântul „accesibil”, care nu este definit în niciun fel în aplicație, îl face lipsit de sens - înseamnă de obicei că linia electrică este situată la o distanță de 10-100 mile (16-160 km) de fermă, dar ceva altceva poate fi înțeles ca accesibilitate. Autorul mai notează că atunci când interpretăm aceleași date, s-ar putea pune accentul opus, scriind: „Puterea electrică nu este disponibilă pentru un sfert din fermele din SUA”.
Capitolul se termină cu o reamintire a importanței de a avea numere în diagrame — un grafic al creșterii câștigurilor unei companii pe parcursul mai multor ani (publicat în revista Fortune) nu spune nimic cititorului, deoarece axa y este lipsită de etichete numerice. Dintr-un astfel de grafic, este imposibil de spus dacă creșterea profiturilor a fost semnificativă, medie sau aproape de zero.
Mult zgomot pentru nimic
Conceptele de interval de încredere și nivel de încredere sunt ilustrate cu exemple din viața reală:
- Diferența dintre scorurile la testul IQ între 98 și 101 face imposibil de a spune care subiect are un IQ mai mare, așa cum se poate vedea din înregistrarea completă a rezultatelor testului: 98 ± 3 și, respectiv, 101 ± 3.
- Măsurarea conținutului de substanțe nocive din diferite mărci de țigări a relevat absența oricărei diferențe semnificative între ele. Cu toate acestea, una dintre mărci a fost pe ultimul loc în ceea ce privește conținutul de substanțe nocive (deși cu o marjă neglijabilă de pe primul loc!). Producătorul acestor țigări (Old Gold) a lansat o campanie publicitară în care susținea că țigările Old Gold conțin cele mai puțin nocive substanțe, potrivit unui laborator independent.
Programul este cât se poate de bun
Primul dintre capitole a fost dedicat luării în considerare a modalităților de manipulare cu ajutorul informațiilor grafice.
Ia în considerare modalități de a distorsiona percepția graficelor:
- „Comprimarea” a unei părți a rețelei de coordonate, aparent pentru a economisi spațiu. În realitate, duce la dificultăți în percepția scalei
- Schimbarea scalei de-a lungul axelor de abscisă și ordonate. Această metodă vă permite să „întoarceți” (vizual) creșterea, aproape de zero, într-un sustenabil pronunțat. De exemplu, este prezentat graficul de creștere a subvențiilor guvernamentale din unul dintre anunțuri. Creșterea a fost de numai 4%, dar vizual arăta aproape ca 400% datorită creșterii scalei de-a lungul axei y.
Imagine schematică
Înțelegerea modalităților de a înșela publicul cu ajutorul infograficelor .
Utilizarea obiectelor grafice asociate cu informațiile prezentate deschide largi oportunități de abuz. Această afirmație este ilustrată de o serie de exemple:
- Pentru a compara două salarii, poți folosi infografice și trage două pungi de bani. Dacă al doilea salariu este de două ori mai mare decât primul, atunci a doua geantă nu va fi doar mai mare, ci și de două ori mai largă (ceea ce este necesar pentru a menține proporția). Și întrucât geanta este un obiect tridimensional, conturul celui de-al doilea sac va fi de două ori mai gros decât primul. Drept urmare, viziunea noastră percepe a doua geantă ca pe o pungă de 8 (nu de 2!) ori mai mare decât prima. Această tehnică a fost folosită de revista Newsweek.
- O reclamă pentru Institutul American de Oțel și Aliaje a folosit un infografic pentru a arăta o creștere a producției de oțel între 1930 și 1940 cu 4,25 milioane de tone (de la 10 milioane la 14,25 milioane). Tehnica infografică (la metodele discutate anterior a fost adăugată distorsiunea deliberată a proporțiilor) a condus la faptul că creșterea indicată a topirii a fost percepută vizual ca 1500%. Autorul notează că acesta este cazul când „aritmetica se transformă în fantezie”.
- Utilizarea imaginilor cu vaci de diferite dimensiuni pentru a arăta producții diferite de lapte de-a lungul anilor. Pe lângă efectele deja discutate, această metodă duce la o altă neînțelegere - cititorul poate crede că nu numai producția de lapte a crescut, dar vacile sunt și mai mari.
Figura de mai jos arată un exemplu de abuz infografic - al doilea obiect este vizual de 8 ori mai mare:
Cifra pseudo-justificată
Capitolul se deschide cu o recomandare usturătoare: „Dacă nu poți dovedi ceea ce vrei, atunci demonstrează altceva și pretinde că aceste lucruri sunt la fel.”
Există multe exemple de astfel de escrocherii. În special:
- Emiterea unui sondaj de opinii ale oamenilor cu privire la egalitatea de șanse pentru albi și afro-americani de a obține un loc de muncă pentru situația reală de pe piața muncii. Acest sondaj poate arăta rezultate mai bune cu cât mai mulți oameni cu prejudecăți rasiale împotriva afro-americanilor participă la el, deoarece astfel de respondenți tind să creadă că nu există discriminare rasială pe piața muncii.
- Reclamele pentru țigări au folosit următorul argument: „Mai mult de 27% dintr-un eșantion mare de medici cunoscuți fumează gutura, cea mai mare rată a oricărei mărci de țigări”. Reclama sugera implicit că medicii știau ceva special, necunoscut de restul, despre răul provocat de diferite mărci de țigări. Dar nu este.
- O reclama pentru un storcator sustinea ca testele de laborator au aratat ca acesta stoarce cu 26% mai mult suc. Când a fost pusă întrebarea - „decât ce?”, a fost primit răspunsul – „decât un storcator manual cu con”. Chiar dacă afirmația inițială este adevărată, nu vă permite să comparați produsul promovat cu produsele concurenților. Poate fi cel mai prost de pe piață, dar totuși depășește un storcator manual cu 26% în eficiența extracției.
- Mortalitatea în marina în timpul războiului hispano-american a fost de 0,09%. Pentru civilii din New York în aceeași perioadă, acesta a fost de 0,16%. Marina a folosit aceste numere pentru a face campanie pentru serviciul militar. Dar este incorect să comparăm acești indicatori - oameni tineri și sănătoși sunt recrutați în flotă, iar bebelușii, bătrânii, oamenii bolnavi sunt recrutați în populația civilă.
Din nou, „după se datorează”
Acest capitol vorbește despre conceptul de corelare și despre confuzia care apare adesea între cauză și efect. Dacă fenomenele A și B apar împreună, atunci acest lucru poate fi explicat în trei moduri:
- Fenomenul A este o consecință a fenomenului B
- Fenomenul B este o consecință a fenomenului A
- Fenomenele A și B sunt consecințe ale altui/altelor fenomene
Sunt date o serie de exemple de judecăți eronate despre relațiile cauzale. În special:
- Studiile au arătat că există mai mulți performanțe slabe în rândul studenților care fumează decât în rândul nefumătorilor. Acest fapt a fost folosit în campania anti-tutun. Dar din acest rezultat nu se poate concluziona că fumatul are un efect negativ asupra abilităților elevilor. Este posibil ca studenții să înceapă să fumeze din cauza performanțelor școlare slabe sau să nu învețe bine și să fumeze din cauza unui al treilea motiv (de exemplu, condiții dificile de viață).
- Cercetările arată o corelație pozitivă între nivelul de studii și venit. Din acest fapt nu se poate trage concluzia că dacă tu (fiul tău, fiica ta etc.) obții studii superioare, atunci cu siguranță și neapărat vor avea un venit mai mare decât dacă nu l-ar fi primit. Mai mult, această corelație nu ne permite să concluzionăm ca regulă generală că studiile superioare sunt cele care conduc la venituri mai mari – poate cei care l-au primit provin din familii înstărite și de aceea primesc un venit mai mare la vârsta adultă. Iată un exemplu de eroare post-hocVezi și Erori logice .
- Un studiu pe 1.500 de absolvenți tipici de vârstă mijlocie a arătat că 93% dintre bărbați erau căsătoriți (față de 83% pentru populația generală), în timp ce doar 65% dintre femei erau căsătorite. Din aceasta se concluzionează că o femeie educată este mai puțin probabil să se căsătorească decât una needucată. Dar studiul nu arată o relație cauzală între aceste fenomene. Poate că aceste femei necăsătorite ar fi rămas necăsătorite chiar dacă nu ar fi absolvit universitatea.
Capitolul se încheie cu un exemplu aproape anecdotic (dar real) al confuziei dintre cauză și efect de către nativii din Noile Hebride. Ei credeau că prezența păduchilor duce la sănătate. Această concluzie a fost făcută pe baza faptului că păduchii au părăsit persoana bolnavă (pentru că, din cauza temperaturii corporale crescute, condițiile de viață pentru acesta au devenit incomode), în timp ce toți oamenii sănătoși le-au avut (cu alte cuvinte, a existat o corelație pozitivă între sănătate și prezența păduchilor).
Cum se produc statistici
Statisticile sunt manipulări statistice. În acest capitol, autorul arată încă o dată cum se manipulează datele statistice folosind exemple specifice. Îndeamnă însă să nu respingă fără discernământ datele statistice, ci să le studieze cu atenție, temeinic, cu prudentă neîncredere, înainte de a lua act.
Cum să puneți statisticile în vigoare
Autorul propune verificarea datelor statistice cu ajutorul a cinci întrebări simple:
- Cine vorbeste?
- De unde știe el asta?
- Ce lipseste?
- Obiectul de studiu este schimbat?
- Are sens?
Ediții în alte limbi
În rusă
- Darell Huff. Cum să minți cu statisticile = Cum să minți cu statisticile. — M .: Editura Alpina , 2015. — 163 p. — ISBN 978-5-9614-5212-9 .
Note
- ↑ „În ultimii cincizeci de ani, How to Lie with Statistics a vândut mai multe copii decât orice alt text statistic.” JM Steele. Darrell Huff și Fifty Years of How to Lie with Statistics Arhivat la 23 februarie 2021 la Wayback Machine . Statistical Science , 20(3), 2005, 205-209.
Link -uri