Jurnalismul de date este o direcție în jurnalism , care se bazează pe prelucrarea datelor și utilizarea acestora pentru a crea material jurnalistic. Datele pot servi atât ca instrument pentru descoperirea unei anumite povești jurnalistice, cât și ca sursă. Dezvoltarea jurnalismului de date este asociată cu dezvoltarea tehnologiilor care permit stocarea și procesarea unor cantități mari de date și mișcarea către o mai mare deschidere a informațiilor.
Jurnalismul de date este legat de domenii precum informatica , designul și statistica .
Primul material cu drepturi depline care reprezintă jurnalismul de date este studiul The Guardian din 1821 [1] , care vorbește despre costul învățământului superior în diferite universități din Marea Britanie . Autorii materialului au întocmit tabele rezumative în care au indicat prețul educației în fiecare instituție de învățământ. Lucrarea a primit recenzii pozitive pentru faptul că, pentru prima dată în practica jurnalistică, toate datele au fost prezentate atât de deschis cititorilor.
În 1858, Florence Nightingale a creat un studiu care analizează starea și pierderile anuale ale armatei britanice [2] . Într-un material de 54 de pagini, autorul oferă o cantitate imensă de date traduse în formă tabelară și diagrame . La baza materialului au fost date „brute” obținute din surse disponibile la acel moment. Lucrarea lui Nightingale formează o investigație jurnalistică cu drepturi depline , a cărei concluzie este că, chiar și pe timp de pace, rata mortalității în armată este aproape de două ori mai mare decât rata mortalității civililor de aceeași vârstă (din cauza unor probleme care nu au nicio legătură cu ostilitățile) . Inovația muncii ei nu a fost în utilizarea graficelor și diagramelor (au fost folosite în materiale jurnalistice chiar înainte de opera lui Nightingale), ci în abordarea datelor „brute”. Cu ajutorul lor, autorul a conceput un material complet transparent (în sensul surselor și datelor utilizate), care, dacă se dorește, poate fi analizat independent de fiecare cititor folosind datele publicate în articol.
Apariția jurnalismului de date în forma sa modernă este asociată cu 1952 - atunci computerul a fost folosit pentru prima dată în munca unui jurnalist [3] . Canalul CBS TV a închiriat puterea de calcul a computerului UNIVAC I pentru a calcula previziunile rezultatelor alegerilor prezidențiale și a evalua rezultatele fiecărui candidați. Această practică de utilizare a computerului pentru jurnalism a ajuns să poarte conceptul de „raportare asistată de computer” ( Computer-assisted reporting (CAR) ).
De la sfârșitul anilor 60, utilizarea analizei computerizate a datelor pentru a crea materiale jurnalistice a devenit mai răspândită. În 1967, Philip Meyer, jurnalist pentru Detroit Free Press , a folosit datele computerizate pentru a crea o poveste despre protestele din oraș [3] . Un alt jurnalist, Bill Dedman, a creat seria de povestiri Color of Money în anii 1980, care a dezvăluit prejudecățile rasiale sistematice în politicile de credit ale instituțiilor financiare de vârf [3] . La începutul anilor 1990, Steve Doig, în lucrarea sa What Went Wrong, a căutat să analizeze pagubele cauzate de uraganul Andrew pentru a înțelege măsura în care deficiențele politicilor și practicilor de dezvoltare urbană au afectat amploarea acestor daune. Raportarea bazată pe date a devenit un serviciu comunitar valoros și a câștigat premii renumite pentru jurnaliști [3] .
La sfârșitul anilor 1980 s-au înregistrat câteva evoluții semnificative în jurnalismul de date. În 1989, The Atlanta Journal-Constitution a câștigat Premiul Pulitzer pentru o serie de rapoarte care foloseau procesarea computerizată a datelor. Institutul Național pentru Raportare Asistată de Calculator (NICAR) [4] a fost format la Școala de Jurnalism de la Universitatea din Missouri . În 1990, acest institut a organizat prima conferință de jurnalism asistată de computer la Universitatea Indiana . De atunci, aceste conferințe au avut loc anual și sunt cele mai mari adunări de jurnalişti de date.
Însuși conceptul de jurnalism de date a fost formulat pentru prima dată în 2010 la o conferință internațională la Amsterdam [5] , în urma căreia această direcție a jurnalismului este considerată formată oficial. Din a doua jumătate a anului 2010, conceptul de jurnalism de date a fost utilizat activ atât la conferințe, cât și în reviste academice.
Primul mijloc media care s-a angajat permanent în jurnalismul de date a fost The Guardian, care a lansat secțiunea Datablog în 2009 [6] , în care toate materialele sunt create folosind procesarea și prezentarea datelor.
Alte medii creează, de asemenea, proiecte bazate pe lucrul cu cantități mari de date. De exemplu, editorii ziarului Las Vegas Sun au petrecut doi ani creând proiectul „Do No Harm” [7] , în cadrul căruia au conceput o întreagă secțiune pe site-ul dedicat problemelor din domeniul medicinei din Las Vegas . În cadrul proiectului, editorii au publicat o serie de articole, reportaje foto, reportaje video, povestiri ale cititorilor, precum și infografice interactive indicând și publicând documente sursă și studii care au devenit baza articolelor jurnalistice. Lucrând cu o serie de 2,9 milioane de dosare ale spitalelor, Las Vegas Sun a reușit să identifice peste 3.500 de cazuri de răni și complicații care au apărut pacienților din vina personalului medical din spitalele orașului (inclusiv incidente care s-au încheiat cu deces). Proiectul a primit un răspuns excelent atât în rândul cititorilor, cât și în rândul guvernului orașului și al comunității de experți medicali.
În 2009, proiectul The New York Times Toxic Waters [8] a câștigat Premiul Pulitzer. A devenit unul dintre cele mai importante exemple de material jurnalistic la intersecția jurnalismului de date și jurnalismului de reportaj . În cadrul proiectului, o echipă de jurnaliști a conceput o serie de infografice, hărți interactive, anchete și date bazate pe analiza documentelor profesionale privind studiul nivelurilor de poluare a apei potabile în diferite state din SUA . Pe lângă analiza problemelor legate de poluarea apei, echipa de jurnaliști care lucrează la proiect a studiat și potențialele riscuri pentru sănătate pe care le pot provoca dozele mari de anumite substanțe, ceea ce face ca proiectul să pară un studiu jurnalistic științific.
O nouă rundă în dezvoltarea jurnalismului de date a fost vizualizarea informațiilor puse la dispoziție datorită Wikileaks . Jurnaliștii Associated Press Jonathan Stray și Julian Burgess au folosit instrumentele de vizualizare open-source The Overview Project și Gephi pentru a procesa 391.832 de documente și a vizualiza o serie de rapoarte disparate despre războiul din Irak [9] . În cadrul proiectului, jurnaliştii au creat un nor de etichete care se regăsesc în întregul set de documente primite din proiectul Wikileaks despre operaţiunile militare din Irak. Vizualizarea rezultată a făcut posibilă evidențierea cuvintelor cheie ale documentelor: „reținut”, „ucis”, „exploziv”, „torturat”. În adnotarea [10] la vizualizare, jurnaliștii au remarcat că, conform datelor disponibile, aproximativ 4.000 de militari americani și aproximativ 100.000 de civili au fost uciși în timpul operațiunilor din Irak. Zeci de mii de incidente raportate de împușcături și tortură au permis jurnaliştilor să afirme cu certitudine că guvernul a acoperit multe fapte despre operațiunea din Irak.
În 2012, Global Editors Network a organizat Data Journalism Awards [11] . De atunci, premiile au fost acordate în fiecare an în mai multe categorii, inclusiv cea mai bună vizualizare a datelor, investigația anului, cel mai bun portofoliu personal, cel mai bun site media și altele.