Distributed Proofreaders (din engleză - „Distributed Proofreaders”) este un proiect web pentru digitizarea cărților pentru proiectul Gutenberg . Ideea din spatele proiectului este ca o masă de voluntari să lucreze împreună pentru a crea cărți electronice, de la etapa de scanare până la postarea textului final pe site-ul web al Proiectului Gutenberg.
Proiectul a fost creat în anul 2000 , de atunci, prin eforturile membrilor săi, catalogul proiectului Gutenberg a fost completat cu peste 15 mii de cărți [1] . Acest număr crește cu o medie de 150-200 de cărți pe lună. În fiecare zi, prima etapă a corecturii trece prin mai mult de 2 mii de pagini.
Din motive istorice, site-ul nu acceptă Unicode , astfel încât numărul de limbi în care cărțile sunt digitizate ca parte a proiectului este sever limitat. Din aprilie 2009, lista limbilor este următoarea:
Cărțile în alte limbi, inclusiv slava, sunt gestionate de proiectul Distributed Proofreaders Europe , care menține Unicode.
În prima etapă, cărțile care nu sunt protejate de drepturi de autor [2] sunt scanate și recunoscute . O parte destul de semnificativă a cărților intră în proiect, ocolind etapa de scanare - din Internet Archive , Google Books și alte surse similare.
Ca rezultat al recunoașterii, se obține, de regulă, un text care conține un anumit număr de erori de recunoaștere ( scannos în engleză ). În acest sens, textul trece printr-o procedură de corectare în trei etape , în timpul căreia corectorul vede pe ecran atât imaginea primită de la scaner , cât și versiunea curentă a textului.
Cartea trece apoi printr-un proces de formatare în doi pași, cu, ca și în pasul precedent, cea mai mare prioritate fiind acordată păstrării textului cât mai aproape de versiunea autorului.
Textul formatat trece prin așa-numita post-procesare și apoi prin verificarea finală. După aceea, cartea este considerată gata pentru încărcare pe site-ul web al Proiectului Gutenberg. [3]