Modelul cauzal , modelul cauzal este un model conceptual care descrie mecanismele cauzale ale unui sistem. Modelele cauzale pot îmbunătăți calitatea cercetării prin furnizarea de reguli clare pentru includerea variabilelor independente în analiză [2] . Acestea pot permite să se răspundă la unele întrebări pe baza datelor observaționale existente, fără a fi nevoie de un studiu intervențional, cum ar fi un studiu controlat randomizat . Unele studii de intervenție nu sunt potrivite din motive etice sau practice, adică fără un model cauzal, unele ipoteze nu pot fi testate [3] .
Modelele cauzale pot ajuta la abordarea problemei validității externe (dacă rezultatele unui studiu se aplică unor grupuri neexplorate). Modelele cauzale pot permite combinarea datelor din mai multe studii pentru a răspunde la întrebări la care niciun set de date nu le poate răspunde. Modelele cauzale sunt falsificabile , iar dacă nu se potrivesc cu datele, atunci ele trebuie respinse ca nevalide. De asemenea, ar trebui să fie de înțeles pentru cei care sunt aproape de fenomenele pe care modelul intenționează să le explice [4] .
Modelele cauzale au aplicații în procesarea semnalelor , epidemiologie și învățare automată . Potrivit lui Judah Pearl , exprimat în The Book of Why , 2018, modelele cauzale sunt un element necesar în dezvoltarea inteligenței artificiale puternice [5] .
Modelele cauzale sunt modele matematice care reprezintă relații cauzale în cadrul unui anumit sistem sau grup. Ele facilitează deducerea relațiilor cauzale din datele statistice. Ele ne pot spune multe despre epistemologia cauzalității și relația dintre cauzalitate și probabilitate . Ele au fost, de asemenea, aplicate la subiecte de interes pentru filozofi, precum teoria deciziei și analiza cauzalității faptice [6] .
Judah Pearl definește un model cauzal ca un triplu ordonat , unde este un set de variabile exogene ale căror valori sunt determinate de factori din afara modelului; — un set de variabile endogene ale căror valori sunt determinate de factori din cadrul modelului; și este un set de ecuații structurale care exprimă valoarea fiecărei variabile endogene în funcție de valorile altor variabile din și [7] .
Aristotel a definit o taxonomie a cauzalității , incluzând cauze materiale, formale, eficiente și finale. Hume a respins abordarea lui Aristotel în favoarea gândirii contrafactuale. La un moment dat, el a negat că obiectele au „puteri” care fac din unul dintre ele o cauză, iar celălalt un efect. Totuși, a adoptat ulterior afirmația: „dacă primul obiect nu ar exista, al doilea nu ar exista niciodată” (condiție necesară pentru cauzalitate) [8] .
La sfârșitul secolului al XIX-lea, statistica a început să prindă contur ca disciplină științifică. După ani de efort de a identifica regulile cauzale pentru domenii precum moștenirea biologică , Galton a introdus conceptul de regresie la medie (observarea sindromului studentului în cursul sportului), ceea ce l-a condus ulterior la conceptul non-cazual de corelare .
Karl Pearson , fiind un pozitivist , a exclus conceptul de cauzalitate din cea mai mare parte a științei ca un caz special nedemonstrabil de asociere și a introdus coeficientul de corelație ca măsură de asociere. El a scris: „Forța ca cauză a mișcării este exact aceeași cu zeul copacului ca cauză a creșterii”, iar cauzalitatea a fost doar „un fetiș printre misterele de neînțeles ale științei moderne”. Pearson a fondat compania Biometrika și laboratorul de biometrie de la University College London , care a devenit lider mondial în cercetarea statistică.
În 1908, Hardy și Weinberg au rezolvat problema stabilității caracteristicilor , iar soluția lor l-a determinat pe Galton să abandoneze cauzalitatea, reînviind moștenirea mendeliană [9] .
În 1921, analiza traseului lui a devenit strămoșul teoretic al modelării cauzale și al graficelor cauzale. El a dezvoltat această abordare într-o încercare de a dezlega influența relativă a eredității , dezvoltării și mediului asupra modelelor de haine de cobai . El și-a susținut afirmațiile teoretice arătând cum o astfel de analiză ar putea explica relația dintre greutatea la naștere a cobaiului, vârsta gestațională și dimensiunea așternutului. Opoziția față de aceste idei a statisticienilor consacrați a dus la faptul că în următorii 40 de ani au fost ignorate (cu excepția crescătorilor de animale ). În schimb, oamenii de știință s-au bazat pe corelații, mulțumită în parte criticului lui Wright Ronald Fisher [10] .
În 1923, Jerzy Neumann a introdus conceptul de rezultat potențial, dar lucrarea sa nu a fost tradusă din poloneză în engleză până în 1990.
În 1958, David Cox a avertizat că variabila Z ar trebui controlată numai dacă este extrem de puțin probabil să fie influențată de variabile independente. În anii 1960, Duncan , Blalock , și Goldberger au redescoperit analiza căilor.
Sociologii s-au referit inițial la modelele cauzale ca modelare a ecuațiilor structurale dar odată ce a devenit o metodă mecanică și-a pierdut utilitatea, făcându-i pe unii practicieni să respingă orice legătură cu cauzalitatea. Economiștii au adoptat partea algebrică a analizei căii, numind-o modelarea simultană a ecuațiilor. Cu toate acestea, ei încă au evitat să atribuie un sens cauzal ecuațiilor lor.
La șaizeci de ani după prima sa lucrare, Wright a publicat o lucrare în care a rezumat prima, în urma criticilor aduse de Carlin și alții care au obiectat că se ocupă doar de relații liniare și că reprezentările de date robuste, fără modele sunt mai revelatoare.
În 1973, David Lewis a susținut înlocuirea corelației cu cauzalitatea (contrafactuale). El s-a referit la capacitatea oamenilor de a-și imagina lumi alternative în care o cauză apare sau nu și în care un efect apare numai după cauza sa. În 1974, Rubin a introdus conceptul de „rezultate potențiale” ca limbaj pentru a pune întrebări cauzale.
În 1983, Nancy Cartwright a sugerat că orice factor care este „legat cauzal” cu un efect ar trebui condiționat, trecând dincolo de simpla probabilitate ca unic ghid.
În 1986, Baron și Kenny au introdus principiile de detectare și evaluare a medierii într- un sistem de ecuații liniare [11] . Începând cu 2014, lucrarea lor a fost al 33-lea cel mai citat din toate timpurile. În același an, Greenland și Robins au introdus abordarea „fungibilității” pentru a gestiona factorii de confuzie luând în considerare contrafactualul. Ei au propus să evalueze ce s-ar fi întâmplat cu un grup de pacienți dacă nu ar fi primit tratament și să compare acest rezultat cu cel al grupului de control . Dacă rezultatele se potrivesc, atunci nu există nicio încurcătură [9] .
În prezent, laboratorul de inteligență artificială al Universității Columbia efectuează cercetări privind aplicarea teoriei modelării cauzale la rețelele neuronale artificiale [12] .
Metamodelul cauzal al lui Pearl include o abstractizare pe trei niveluri, pe care el o numește scara cauzalității. Nivelul cel mai de jos, asociativ (a vedea/observa), presupune perceperea tiparelor sau tiparelor în datele de intrare, exprimate ca corelații. Nivelul mediu, intervenția, prezice consecințele acțiunilor intenționate, exprimate ca relații cauzale. Cel mai înalt nivel, contrafactual, presupune construirea unei teorii care să explice de ce acțiunile specifice au efecte specifice și ce se întâmplă în absența unor astfel de acțiuni [9] .
Un obiect este asociat cu altul dacă observarea unuia modifică probabilitatea de a-l observa pe celălalt. Exemplu: clienții care cumpără pastă de dinți au șanse mai mari să cumpere și ață dentară . Asociațiile pot fi măsurate și prin calcularea corelației a două evenimente. Asociațiile nu au sens cauzal. Un eveniment poate provoca celălalt, invers poate fi adevărat sau ambele evenimente pot fi cauzate de un al treilea eveniment.
Acest nivel afirmă anumite relații cauzale între evenimente. Cauzalitatea se evaluează prin efectuarea experimentală a unei acțiuni care afectează unul dintre evenimente. Exemplu: Dacă am dubla prețul pastei de dinți, care ar fi noua probabilitate de cumpărare? O relație cauzală nu poate fi stabilită prin examinarea istoricului modificărilor de preț, deoarece modificarea prețului ar fi putut fi cauzată de o altă cauză, care ar fi putut influența ea însăși al doilea eveniment (un tarif care crește prețul ambelor bunuri) [13] .
Cel mai înalt nivel, contrafactual, implică luarea în considerare a unei versiuni alternative a unui eveniment trecut sau a ceea ce s-ar fi putut întâmpla în circumstanțe diferite pentru aceeași configurație experimentală. De exemplu, care este probabilitatea ca, dacă un magazin ar dubla prețul aței dentare, un client de pastă de dinți să-l cumpere în continuare?
Contrafactualele pot indica existența unei relații cauzale. Modelele care includ contrafactuale permit intervenții precise ale căror consecințe pot fi prezise. În cazul extrem, astfel de modele sunt acceptate ca legi fizice, de exemplu, legea inerției spune că dacă nu se aplică o forță unui obiect staționar, acesta nu se va mișca [9] .
Statistica se învârte în jurul analizei relațiilor dintre mai multe variabile. În mod tradițional, aceste relații sunt descrise ca corelații , asocieri fără nicio cauzalitate implicită . Modelele cauzale încearcă să extindă acest cadru prin adăugarea conceptului de cauzalitate, în care modificările unei variabile provoacă modificări în altele [7] .
Definițiile cauzalității din secolul al XX-lea s-au bazat exclusiv pe probabilități/asocieri. S-a spus că un eveniment (X) provoacă altul dacă crește probabilitatea altuia (Y). Matematic, aceasta este exprimată ca
Astfel de definiții sunt inadecvate deoarece alte relații (de exemplu, o cauză comună pentru X și Y) pot satisface condiția. Cauzalitatea are de-a face cu a doua treaptă a scării. Asociațiile sunt în prima etapă și oferă doar dovezi pentru cea din urmă. O definiție ulterioară a încercat să rezolve această ambiguitate fiind condiționată de factori de fond. Matematic, aceasta este exprimată ca
unde K este un set de variabile de fundal, iar k sunt valorile acestor variabile într-un anumit context. Cu toate acestea, setul necesar de variabile de fundal este nedefinit atâta timp cât probabilitatea este singurul criteriu, deoarece seturile multiple pot crește probabilitatea.
Alte încercări de a determina cauzalitatea includ cauzalitatea Granger , un test statistic al ipotezei că cauzalitatea în economie poate fi evaluată prin măsurarea capacității de a prezice valorile viitoare ale unei serii de timp folosind valorile anterioare ale altei serii de timp.
Cauza poate fi necesară, suficientă, favorabilă sau poate avea mai multe dintre aceste proprietăți [14] .
NecesitatePentru ca un eveniment x să fie o cauză necesară a lui y, prezența lui y trebuie să implice apariția anterioară a lui x. Prezența lui x, totuși, nu înseamnă că y se va întâmpla. Aceasta înseamnă că y nu s-ar fi întâmplat dacă x nu ar fi apărut.
Motive suficientePentru ca un eveniment x să fie o cauză suficientă a lui y, prezența lui x trebuie să implice apariția ulterioară a lui y. Cu toate acestea, o altă cauză a lui z poate provoca independent y. Astfel, prezența lui y nu necesită apariția anterioară a lui x [15] .
Cauze asociatePentru ca x să fie o cauză concomitentă a lui y, prezența lui x trebuie să crească probabilitatea lui y. Dacă probabilitatea este de 100%, atunci se spune că x este suficient. Poate fi necesară și o cauză concomitentă [16] .
O diagramă cauzală este un grafic direcționat care afișează relațiile cauzale dintre variabile într-un model cauzal. Include un set de variabile (sau noduri ). Fiecare nod este conectat printr-o săgeată la unul sau mai multe alte noduri asupra cărora are un efect cauzal. O săgeată definește direcția cauzalității , de exemplu, o săgeată care conectează variabilele A și B cu o săgeată în punctul B indică faptul că o modificare în A determină o schimbare în B (cu o probabilitate adecvată). O cale este o parcurgere a graficului între două noduri urmând săgețile cauzale.
Diagramele cauzale includ diagrame ciclice , grafice aciclice direcționate și diagrame Ishikawa [9] .
Diagramele cauzale nu depind de probabilitățile cantitative. Modificările acestor probabilități (de exemplu, datorită îmbunătățirilor tehnologice) nu necesită modificări ale modelului.
Modelele cauzale au structuri formale cu elemente cu proprietăți specifice.
Modele de conexiuneExistă 3 tipuri de conexiuni de trei noduri - circuite liniare, furci și colidere .
LanțuriLanțurile sunt linii drepte de comunicație cu săgeți îndreptate de la cauză la efect. În acest model, B este un mediator în sensul că el mediază impactul pe care A l-ar avea asupra lui C.
Furci
În furci, o cauză are multe consecințe. Există o corelație necauzoală, falsă între A și C, care poate fi eliminată prin condiționarea lui B pentru o anumită valoare a lui B.
Dezvoltarea furcii arată astfel:
În astfel de modele, B este cauza comună a lui A și C (care provoacă și A), făcându-l pe B mediatorul.
ColliderLa colisionare, cauze multiple afectează același rezultat. Condiționarea pentru o anumită valoare a lui B dezvăluie adesea o corelație negativă necauzoală între A și C. Această corelație negativă a fost denumită eroarea colisionantului : B explică corelația dintre A și C. Corelația poate fi pozitivă atunci când contribuțiile ambelor A și C sunt necesare pentru a influența B:
O variabilă proxy modifică influența altor cauze asupra rezultatului (spre deosebire de simpla influență a rezultatului). De exemplu, în exemplul de mai sus, circuitul B este mediatorul deoarece schimbă influența lui A (cauza indirectă C) în C (rezultat).
Variabila de confuzieO variabilă de confuzie ( confuzor ) afectează mai multe rezultate prin crearea unei corelații pozitive între ele.
Variabila instrumentuluiVariabila instrumentului:
Coeficienții de regresie pot măsura efectul cauzal al unei variabile instrumentale asupra rezultatului, atâta timp cât acel efect nu este încurcat.[ specificați ] . Astfel, variabilele instrumentale permit cuantificarea factorilor cauzali fără date despre variabilele de confuzie.
De exemplu, în model:
unde Z este o variabilă instrumentală deoarece are o cale către rezultatul Y și nu are bază, de exemplu, pentru U.
Puteți îmbunătăți acuratețea modelului condiționând o altă variabilă pentru a bloca căile dintre instrument și agent de confuzie și combinând mai multe variabile pentru a forma un singur instrument.
Condițiile de independență sunt reguli pentru a decide dacă două variabile sunt independente una de cealaltă. Variabilele sunt independente dacă valorile uneia nu afectează direct valorile celeilalte. Mai multe modele cauzale pot împărtăși condiții de independență. De exemplu, modele
și
au aceleași condiții de independență, deoarece condiționalitatea pe B lasă A și C independente. Cu toate acestea, cele două modele nu au aceeași valoare și pot fi falsificate pe baza datelor (adică, dacă datele observaționale arată o relație între A și C după condiționarea pe B, atunci ambele modele sunt greșite). În schimb, datele nu pot arăta care dintre cele două modele este corectă deoarece au aceleași condiții de independență. Condiționarea unei variabile este un mecanism pentru efectuarea de experimente ipotetice. Condiționarea variabilei implică examinarea valorilor altor variabile pentru o anumită valoare a variabilei condiționate. În primul exemplu, condiționarea pe B implică faptul că observațiile pentru o valoare dată a lui B nu ar trebui să arate nicio relație între A și C. Dacă o astfel de relație există, atunci modelul este greșit. Modelele non-cauzale nu pot face astfel de distincții deoarece nu fac afirmații cauzale.
Un element important al cercetării de corelație este identificarea influențelor potențial conflictuale asupra variabilei studiate, cum ar fi demografia . Cu toate acestea, lista corectă a variabilelor de confuzie nu poate fi determinată a priori. Astfel, este posibil ca studiul să controleze variabile irelevante sau chiar (indirect) variabila studiată.
Modelele cauzale oferă o metodă fiabilă de identificare a variabilelor de confuzie relevante. În mod formal, Z este un factor de confuzie dacă Y este conectat la Z prin căi care nu trec prin X. Acestea pot fi adesea determinate folosind date colectate pentru alte studii.
Pentru a analiza influența cauzală a lui X asupra lui Y într-un model cauzal, toate variabilele de confuzie trebuie ajustate.