Proiectul Gutenberg | |
---|---|
Engleză Proiectul Gutenberg | |
URL | gutenberg.org |
Comercial | Nu |
Tip site | Biblioteca digitală |
Înregistrare | este gratuit |
limbi) | Engleză |
Proprietar | Proiectul Gutenberg |
Autor | Michael Hart |
Începutul lucrării | 1971 |
Statusul curent | lucrări |
Țară | |
Fișiere media la Wikimedia Commons |
Proiectul Gutenberg ( în engleză Project Gutenberg , sau PG ) este o inițiativă publică non-profit care vizează crearea și distribuirea unei colecții digitale de lucrări în domeniul public . Gutenberg este considerată cea mai veche bibliotecă digitală din lume. Majoritatea lucrărilor au fost digitalizate de voluntari și sunt disponibile pentru descărcare gratuită.
Proiectul a fost creat la 4 iulie 1971, când studentul de la Universitatea din Illinois , Michael Hart , a tastat manual textul Declarației de Independență a SUA și l-a trimis altor utilizatori ai rețelei sale, la acea vreme constând din 15 noduri ale ARPANET - progenitor al Internetului [1] [2] . În următorii 20 de ani, Hart a retipărit aproximativ 100 de cărți. Odată cu răspândirea internetului la începutul anilor 1990, voluntarii universitar și, deja în anii 2000, organizațiile Distributed Proofreaders s-au alăturat digitizării lucrărilor . Hart s-a ocupat de munca administrativă și strângerea de fonduri pentru a menține site-ul în funcțiune. În 1997, numărul lucrărilor din colecție era de 1000, în 2003 - 10.000 , în 2011 - 40.000 . Pentru 2021, Proiectul are peste 60.000 de cărți în colecția sa [1] .
Toate textele electronice sunt digitizate în codul ASCII standard american de 7 biți numit Plain Vanilla. Acest format poate fi citit pe orice dispozitiv și este compatibil cu 99% din orice software. Pentru cărțile cu caractere accentuate, precum cele în germană și franceză, Project Gutenberg creează și o versiune ASCII pe 7 biți cu accente [3] . Pe lângă Plain Vanilla ASCII, Gutenberg folosește și alte formate, inclusiv HTML , XML , RTF , Unicode [3] .
Data oficială a creării proiectului este 4 iulie 1971, când un student de la Universitatea din Illinois, Michael Hart , a reintrodus manual textul Declarației de Independență a SUA și l-a trimis altor utilizatori ai rețelei ARPANET , care consta din 15 noduri și aproximativ 100 de utilizatori înregistrați [2] . La acea vreme, trimiterea unui fișier de 5 kilobyte ar fi cauzat o întrerupere a rețelei, așa că Hart a trimis o locație digitală de stocare a textului, după care a fost descărcat de șase utilizatori [3] [4] .
Implementarea proiectului a devenit posibilă datorită faptului că lui Hart i s-a oferit posibilitatea de a lucra cu mainframe -ul Xerox Sigma 5 - ulterior creatorul proiectului a considerat că timpul de calculator alocat lui valorează aproximativ 100 de milioane de dolari . Studentul a vrut să petreacă acest timp într-un proiect „meritător”, dar nu a fost atras de prelucrarea datelor - zona principală a computerelor la acea vreme [5] [6] .
Dintr-un interviu scris cu Michael Hart [4]M-am oprit din greșeală pe drum la magazinul nostru local IGA. Sărbătorirea bicentenarului Americii era pe cale să aibă loc , iar împreună cu produsele mi-au pus documente istorice din pergament artificial. Așa că, în timp ce scotoceam prin rucsac după ceva de mâncare, am găsit Declarația de Independență a SUA și mi-a apărut o idee în cap. Pentru o vreme m-am întrebat dacă aș putea veni cu ceva ce aș putea face cu un computer care ar fi mai important decât emiterea Declarației de Independență – ceva care va mai exista peste 100 de ani de acum înainte. Totuși, nu m-am putut gândi la nimic și s-a născut Proiectul Gutenberg.
Hart este numit „primul furnizor de informații” pentru că a început să înțeleagă web-ul ca un nou tip de mass-media cu aproape 20 de ani înainte ca Tim Berners-Lee să formuleze conceptul World Wide Web [7] . Declarația de independență a fost prima carte electronică din lume [4] . Ulterior, Hart a început să caute și să digitalizeze cărți de bibliotecă aflate deja în domeniul public . Practic, acestea au fost lucrări fundamentale pentru istoria Statelor Unite - Bill of Rights , Constituția , King James Bible , Complete Works of William Shakespeare , " Alice in Wonderland " de Lewis Carroll , " Peter Pan " de James Barry și alte lucrări. Toate aceste cărți au fost digitalizate manual, dactilografiate de Hart și voluntari [8] [7] [3] [9] .
Filosofia proiectului se bazează pe convingerea că cea mai mare valoare a tehnologiei informatice constă în conservarea și difuzarea informațiilor. Scopul inițial al proiectului a fost digitalizarea celor mai populare 10.000 de cărți [10] .
Odată cu dezvoltarea și introducerea pe scară largă a Internetului la sfârșitul anilor 1980, proiectul a câștigat o mare popularitate. Până în 1990, la Universitatea din Illinois a fost creat un cerc de voluntari pentru a-l ajuta pe Hart să scrie texte. Viteza muncii lor a crescut treptat, iar până în 1995 colecția proiectului a fost completată cu o medie de 16 texte pe lună. În același timp, era introdusă tehnologia de recunoaștere optică a caracterelor . În anii 1990, a fost creat primul site web al proiectului și s-a încheiat un acord cu Universitatea Carnegie Mellon din Pittsburgh pentru preluarea finanțelor proiectului [7] .
La începutul anilor 2000, mișcarea Distributed Proofreaders , formată de Charles Franks în 2000, a început să ajute proiectul . Peste o mie de voluntari din mai multe țări au lucrat pentru a produce și a posta texte online în domeniul public care au o semnificație culturală semnificativă. Datorită acestei colaborări, pentru anul 2017, catalogul Gutenberg a primit de la 150 la 200 de cărți pe lună [7] . Prin comparație, în primele 11 săptămâni din 2004, Proiectul Gutenberg a adăugat 313 noi cărți electronice, în timp ce primele 313 cărți electronice au durat aproximativ 26 de ani pentru a fi finalizate [4] . Până în primăvara anului 2002, colecția proiectului conținea aproape un sfert din toate lucrările din domeniul public disponibile pe Internet [3] . Încă din octombrie 2003, proiectul avea 10.000 de cărți electronice [11] .
În 2007, Wattpad și Gutenberg au dezvoltat și lansat împreună un proiect care a făcut 17.000 de cărți disponibile pentru descărcare pe majoritatea telefoanelor mobile [12] .
La începutul anilor 2000, Michael Hart, împreună cu fondatorul World eBook Library, John Guallardo, au încercat să lanseze Proiectul Gutenberg 2. Totuși, inițiativa nu a fost implementată deoarece proiectul presupunea descărcări plătite de lucrări individuale, ceea ce nu a stârnit entuziasm. printre utilizatori [10] .
Hart a murit în 2011. Pentru 2021, CEO -ul proiectului a fost Gregory Newby [13] [14] .
Proiectul este implicat în digitalizarea lucrărilor disponibile publicului. Procesul de completare a colecției se desfășoară în trei etape principale - prin scanare, recunoaștere și corectare. După rezolvarea problemei cu statutul juridic al lucrării și puritatea licențiată a acesteia, participanții la proiect scanează documentul și rulează programul de recunoaștere optică a caracterelor . Voluntarii verifică, recitesc și corectează apoi textul, comparându-l atât cu versiunea scanată, cât și cu pagina originală. În medie, chiar și cu software-ul OCR îmbunătățit, voluntarii găsesc aproximativ 10 erori pe pagină. Fiecare carte este revizuită de doi voluntari diferiți care fac orice corecții necesare. În cazul în care lucrarea originală este în stare proastă, ceea ce se întâmplă adesea cu cărțile vechi, textul este introdus manual. Personalul proiectului este convins că stadiul corectării de către oameni este unul dintre cele mai importante, deoarece simpla scanare a lucrării și plasarea acesteia în domeniul public nu permite căutarea prin texte [3] [15] . În medie, este nevoie de aproximativ 50 de ore pentru a lucra la un text [3] .
Toate textele electronice sunt digitizate în codul ASCII standard american de 7 biți numit Plain Vanilla. Acest format poate fi citit pe orice dispozitiv și este compatibil cu 99% din orice software. Pentru cărțile cu caractere accentuate, precum cele în germană și franceză, Project Gutenberg creează și o versiune ASCII pe 7 biți cu accente [3] . Pe lângă Plain Vanilla ASCII, Gutenberg folosește și alte formate, inclusiv HTML , XML , RTF , Unicode [3] .
Considerăm cărțile electronice ca pe un mediu nou care nu are nicio legătură reală cu hârtia, cu excepția prezentării aceluiași conținut. Cu toate acestea, nu văd cum hârtia poate concura cu versiunile electronice, mai ales dacă fiecare își găsește propriul mod convenabil de a folosi textele electronice, mai ales în școli.Michael Hart [3]
Cu recunoașterea textului, utilizatorii pot căuta în literatura de specialitate cu o funcție de căutare disponibilă în orice browser și orice software de procesare a textului. În căutarea avansată, puteți completa mai multe câmpuri: autor, titlu, subiect, limbă, categorie (oricare, carte audio, muzică, imagini), LoCC ( clasificare catalog Library of Congress ), tip fișier (text, PDF, HTML, XML). , JPEG etc.) e.) și numărul textului electronic / cărții electronice [3] . Nu este necesară nicio taxă sau înregistrare pentru a citi online sau a descărca lucrarea [10] .
Serverele portalului sunt localizate și înregistrate în SUA. Din acest motiv , legea SUA este folosită pentru a determina drepturile de autor . Cu toate acestea, legea drepturilor de autor este fragmentată și poate varia considerabil în funcție de jurisdicție. Acest lucru poate duce la o carte de domeniu public din SUA să fie protejată prin drepturi de autor într-o altă țară. Portalul descrie în mod specific „termenii de utilizare”, care specifică faptul că utilizatorii din afara SUA ar trebui să verifice termenii drepturilor de autor din țările lor înainte de a descărca sau distribui cărți electronice din proiect [16] .
ÎncuietoriÎn 2015, a fost intentat un proces împotriva proiectului în Germania din cauza nerespectării drepturilor de autor în legătură cu 18 publicații germane din colecția bibliotecii, care erau disponibile gratuit în Statele Unite, dar erau simultan protejate de drepturi de autor în Germania [16] . Acțiunea a fost intentată în numele editurilor S. Fischer Verlag și GmbH., deținute de Holtzbrinck Publishing Group [17] . Pe 9 februarie 2018, o instanță germană a decis că Gutenberg trebuie să blocheze accesul la 18 lucrări, să furnizeze o listă cu utilizatorii care au încărcat aceste lucrări și să plătească o parte din costurile judiciare ale reclamantului. Ca răspuns, site-ul a blocat temporar toate adresele IP din Germania [18] [19] .
În 2020, Proiectul Gutenberg a fost blocat de furnizorii de servicii de internet din Italia în urma acuzațiilor de încălcare a drepturilor de autor [20] .
An | Cărți digitizate |
---|---|
1997 | 1000 |
1999 | 2000 |
2000 | 3000 |
2001 | 4000 |
2002 | 5000 |
2003 | 10.000 |
2005 | 15.000 |
2008 | 24 000 |
2009 | 34 000 |
2015 | 48 000 |
2018 | 56 000 |
2021 | 60 000 |
Din 1991 până în 1996, numărul lucrărilor publicate s-a dublat aproximativ. Pe lângă digitizarea cărților, Michael Hart a început să coordoneze munca a zeci de voluntari [3] . În august 1998, Hart și-a propus să pună aproximativ 10.000 de texte electronice pe web, iar până în octombrie 2003 a atins-o. Următorul obiectiv a fost digitizarea a 1.000.000 de lucrări [3] .
În 1993, colecția a fost împărțită în trei categorii principale: „literatură ușoară” (mai ales ficțiune); „literatură grea” precum Biblia , Shakespeare sau Moby Dick ; precum și „literatură de referință” - tezaurul lui Roger , precum și un set de enciclopedii și dicționare [3] [9] .
În ianuarie 2005, colecția proiectului includea 15.000 de cărți electronice, iar în 2015, peste 49.200 de cărți electronice gratuite, toate publicate anterior de edituri de prestigiu [10] .
Deoarece proiectul are sediul în SUA, inițial a fost destinat publicului vorbitor de limba engleză și cărțile digitizate exclusiv în limba engleză. Cu toate acestea, din octombrie 1997, Hart a decis să extindă colecția și să lanseze cărți electronice în alte limbi, în principal în engleză, franceză, germană, spaniolă, finlandeză, olandeză și chineză [3] . Deja în 2004, lucrările colecției au fost prezentate în 25 de limbi, iar în iulie 2005 - în 42, inclusiv limbi irocheze , sanscrite , mayașe [3] .
În aprilie 1995 au apărut primele imagini în colecția Gutenberg - picturi rupestre franceze , care în noiembrie 2000 au devenit disponibile publicului în format XHTML [3] .
CD și DVDÎn august 2003, Gutenberg a lansat CD -ul „Best of Gutenberg” cu 600 dintre cele mai populare lucrări din colecția bibliotecii. În decembrie 2003, DVD -ul „Proiectul Gutenberg” a fost compilat cu 9.400 de titluri - care, la acea vreme, reprezentau aproape întreaga colecție a „Gutenberg”. În iulie 2007, a fost lansată o nouă versiune DVD cu 17.000 de cărți, iar în aprilie 2010 a fost lansat un DVD actualizat cu două straturi, cu 30.000 de lucrări. Utilizatorii pot descărca imagini ISO sau pot solicita o copie gratuită prin poștă. În octombrie 2010, proiectul a trimis aproximativ 40.000 de discuri. Pentru 2021, imaginile ISO sunt disponibile pentru descărcare, dar livrarea gratuită a CD-urilor a fost întreruptă [21] [22] .
Colecția proiectului este considerată cea mai veche bibliotecă electronică din lume, iar Michael Hart este creatorul primei cărți digitale [3] [9] . Biblioteca a servit ca prototip pentru o serie de alte proiecte, inclusiv [23] [3] :
Gutenberg colaborează și cu Internet Archive și LibriVox [31] .
O serie de inițiative s-au încheiat deja - Proiectul Gutenberg în Filipine, Proiectul Europa, condus de Proiectul sârb Rastko, Proiectul Gutenberg Rusia (numit și „Rutenberg” după denumirea europeană medievală a Rusiei pentru Rutenia ), Proiectul Gutenberg din Taiwan , supravegherea unei colecții de cărți electronice în engleză și chineză [32] [3] .
În 2016, a fost lansată o aplicație Android bazată pe colecția Gutenberg [33] .
Proiecte separate sunt angajate în conversia lucrărilor digitalizate de proiect în alte formate electronice. Astfel, Blackmask Online convertește lucrări în opt formate diferite bazate pe Open eBook . Manybooks.net a convertit cărțile electronice ale Proiectului în formate care pot fi citite de PDA . Bookshare , prima bibliotecă digitală pentru persoanele cu deficiențe de vedere din Statele Unite, convertește cărțile în Braille și DAISY [3] . Multe texte sunt folosite de proiectul LibriVox pentru a crea cărți audio [34] .
![]() | ||||
---|---|---|---|---|
Site-uri tematice | ||||
Dicționare și enciclopedii | ||||
|
dispozitive și documente ) | Cărți electronice (|
---|---|
Seria de dispozitive | |
Formate de fișiere | |
Catalogori | |
Biblioteci | |
Vezi si |