Arhivarea electronică ( conservarea digitală ) este un set de practici, strategii și fluxuri de lucru pentru protejarea documentelor electronice împotriva învechirii și pierderii de informații. Activitățile de arhivare digitală urmăresc să creeze, să mențină și să păstreze integritatea informațiilor digitale. Pentru a face referire la practica arhivării electronice, sunt folosiți mai mulți termeni - conservare digitală (la propriu - conservare electronică sau digitală), arhivare digitală (arhivare electronică sau digitală) sau management digital (gestionarea datelor digitale). Adesea, aceste concepte sunt folosite interschimbabil, dar utilizarea termenilor individuali variază în funcție de țară.
Practica arhivării electronice a început să apară la mijlocul anilor 1990, când, odată cu dezvoltarea tehnologiei informației și a noilor tipuri de medii digitale , s-a ridicat din ce în ce mai mult problema necesității stocării pe termen lung a obiectelor digitale. Necesitatea acestui lucru a apărut din cauza duratei de viață relativ scurte a mediilor digitale - de exemplu, fiabilitatea stocării informațiilor pe dischete și carduri de memorie este de doar câțiva ani, iar în cazul discurilor optice - de la 3 la 20 de ani. Benzile magnetice sunt considerate cele mai stabile modalități de stocare a informațiilor , pe care datele pot fi stocate în mod fiabil de la 15 la 30 de ani. Până la începutul anilor 1990, informațiile digitale erau duplicate în copii pe hârtie. Nu toate materialele au fost însă arhivate în acest fel – fiind închise publicului, multe documente electronice nu au fost supuse arhivării.
Activitățile de arhivare electronică sunt reglementate printr-o serie de standarde internaționale acceptate și rapoarte ale grupului de lucru, inclusiv modelul Open Archival Information System (OAIS), Trusted Digital Repository, Digital Preservation Network (DPN), InterPARES Project , PRONOM și altele. Procesul de arhivare a materialelor digitale se realizează prin strategii de conservare (lucrarea cu materiale în formate originale și pe suporturi originale, folosind tehnologia originală sau hardware și software utilizat anterior), emulare (reproducerea funcționalității unui sistem învechit pentru a asigura lucrul cu materiale învechite ). formate de date), încapsulare (includerea unei descrieri tehnice a documentului în obiectul digital în sine, reducând astfel dependența acestuia de mediul extern, deoarece aceste informații vă permit fie să reproduceți mediul original, fie să transferați documentul într-unul nou) , migrarea (transferul documentelor electronice pe alte medii sau către alt sistem de operare - de exemplu, de pe bandă magnetică pe CD), arheologie digitală (o metodă de arhivare a materialelor, care constă în salvarea acelor obiecte digitale devenite inaccesibile din cauza uzurii tehnologice ). și/sau degradare fizică), strategii de reînnoire (transfer informații de pe un mediu durabil pe altul) sau arhivare web ( procesul de colectare, conservare și extragere a site-urilor web și a materialelor de pe Internet pentru a le plasa într-o arhivă electronică pentru a fi accesată de generațiile viitoare).
Primele încercări de automatizare a acțiunilor pot fi urmărite încă din secolul al XIV-lea, când au fost inventate carillonele - clopotnițe mecanice controlate de un mecanism de pedală care aducea pârghiile în secvența dorită pe măsură ce se roteau datorită prinderii de un cilindru metalic cu știfturi [1] . Acest principiu al automatizării tamburului a fost introdus ulterior în industria textilă – în secolul al XVIII-lea s- a creat prima carte perforată sau bandă de hârtie cu găuri, prin care treceau navete [2] . Curând, cardurile perforate au început să fie folosite pentru automatizarea calculelor, ele au stat la baza motorului analitic al lui Charles Babbage [3] , iar mai târziu - tabulatoare și calculatoare din prima generație [4] [5] .
Până în anii 1970, cardurile perforate erau utilizate pe scară largă pentru stocarea și introducerea datelor - pe ele puteau fi codificate până la 80 de caractere. Cu toate acestea, dezvoltarea rapidă a computerelor a dus la apariția unor modalități alternative de stocare și automatizare a datelor [6] . În 1954, a fost creat primul suport magnetic IBM 350 , iar în 1956, un hard disk [7] . Deja în anii 1960, cardul perforat a fost înlocuit cu bandă magnetică , care a devenit metoda principală de înregistrare și procesare automată a informațiilor [8] [9] . Odată cu dezvoltarea și introducerea discurilor magnetice și a memoriei flash pentru stocarea și înregistrarea informațiilor, capacitatea și performanța acestora au crescut semnificativ. A apărut însă problema fragilității mediilor de stocare, care a afectat negativ siguranța datelor. Astfel, fiabilitatea stocării informațiilor pe discuri magnetice și carduri flash este de doar câțiva ani - aceste medii sunt instabile atât la temperaturi de peste 100 ℃, cât și la câmpuri electromagnetice puternice . Informațiile de pe discurile optice sunt șterse treptat sub influența 50-70 ℃, acestea sunt capabile să stocheze date de la 3 la 20 de ani. Cele mai fiabile modalități de stocare a informațiilor sunt benzile magnetice, pe care datele pot fi stocate de la 15 la 30 de ani [10] .
Odată cu dezvoltarea tehnologiei informației și a noilor tipuri de medii digitale, problema stocării pe termen lung a informațiilor electronice a devenit mai relevantă. Până la începutul anilor 1990, majoritatea informațiilor digitale erau duplicate pe copii pe hârtie. Cu toate acestea, nu toate materialele au fost arhivate în acest fel, iar multe documente electronice nu au fost supuse arhivării pe hârtie din cauza închiderii publicului [11] [12] . Primele proiecte de arhivare electronică au început să apară în a doua jumătate a anilor 1990. Așadar, în 1996, proiectul australian Preserving Access to Digital Information (PADI) a primit finanțare guvernamentală. Execuția sa a fost încredințată Bibliotecii Naționale a Australiei . PADI a publicat rapoarte de proiect și articole de jurnal pe o gamă largă de subiecte și a văzut, de asemenea, formarea unei comunități profesionale în domeniul conservării digitale [13] . În același an au fost lansate proiectul de arhivare web Internet Archive [14] fondat de Brewster Keil , proiectele Bibliotecii Naționale a Suediei (Proiectul Patrimoniului Kulturarw) și Bibliotecii Naționale a Australiei (Proiectul PANDORA) [15] . În 1998, un număr de biblioteci naționale europene au format Biblioteca de depozit în rețea europeană (NEDLIB) pentru a păstra obiectele electronice în sistemul bibliotecilor [16] . În același timp, au început să se dezvolte proiecte de dezvoltare a unor strategii eficiente de arhivare - Arts and Humanities Data Service (1999) și Proiectul CAMiLEON (1999). Începând cu anii 2000, practicile de conservare a datelor electronice au fost introduse peste tot. Astfel, în 2000, Biblioteca Congresului a inițiat Inițiativa Minerva pentru a colecta și arhiva informații electronice, iar proiectul Dutch Digital Preservation Testbed a devenit parte a programului național de conservare a informațiilor digitale. În 2001, a fost formată Digital Preservation Coalition - o coaliție de organizații pentru a implementa practici de arhivare electronică în Marea Britanie și în alte țări. În 2006, a fost fondat un proiect similar - Digital Preservation Europe [17] [18] .
Strategiile de arhivare electronică care sunt implementate la nivel mondial au schimbat rolurile bibliotecilor, arhivelor și editorilor responsabili în mod tradițional de arhivarea informațiilor. Începând cu anii 2000, în conservarea înregistrărilor electronice s-au implicat și organizații private, centre de date științifice, organizații non-profit [19] .
În 2003, UNESCO a încercat să reunească eforturile internaționale pentru a crea o abordare sistematică a arhivării electronice prin publicarea Cartei de conservare digitală, solicitând comunității mondiale să implementeze strategii de conservare a obiectelor electronice pe cale de dispariție. În 2012, la conferința programului UNESCO Memoria Lumii , s-a reiterat necesitatea unui efort internațional unificat pentru păstrarea și asigurarea accesului la moștenirea electronică. Drept urmare, programul PERSIST a fost creat în 2013, având ca scop conservarea patrimoniului documentar mondial [20] [21] .
Scopul conservării patrimoniului digital este de a-l face accesibil publicului. Prin urmare, accesul la materialele de patrimoniu digital, în special la cele din domeniul public, ar trebui să fie liber de restricții nerezonabile. În același timp, trebuie asigurată protecție împotriva oricărei forme de încălcare a securității informațiilor cu caracter confidențial și privat.[...]
Există pericolul ca moștenirea digitală a lumii să se piardă iremediabil pentru generațiile viitoare. Factorii care contribuie la aceasta includ învechirea echipamentelor și a programelor care oferă acces la materiale digitale, incertitudinea în materie de furnizare a resurselor, responsabilitatea și metodele de asigurare a conservării și conservării, absența actelor legislative corespunzătoare.[...]
În cazul neasumarea măsurilor menite să prevină amenințările predominante, va avea loc o pierdere rapidă și inevitabilă a moștenirii digitale. Adoptarea unor măsuri de natură juridică, economică și tehnică care vizează conservarea patrimoniului va aduce beneficii statelor membre. Există o nevoie urgentă de a crește gradul de conștientizare și de a crește advocacy, de a atrage atenția factorilor de decizie politică și de a stimula interesul public atât pentru potențialul media digitală, cât și pentru aspectele practice ale conservării digitale.
Mai mulți termeni sunt folosiți pentru a desemna practici de arhivare electronică - conservare digitală (din engleză - „electronic / digital conservation”), arhivare digitală (din engleză - „electronic / digital archiving”) sau management digital (din engleză - „management of electronic / digital) date digitale"). Adesea, aceste concepte sunt folosite interschimbabil, dar utilizarea termenilor individuali variază în funcție de țară. De exemplu, în Statele Unite, termenul „conservare digitală” ( conservare digitală ) este folosit mai des și, de regulă, acoperă toate activitățile de gestionare a arhivelor electronice din momentul în care acestea sunt create. Termenul „conservare digitală” a fost folosit pentru prima dată în 1992 într-un articol din revista Theatre Crafts despre noile tipuri de conservare digitală. În Marea Britanie, dimpotrivă, termenul „management digital al datelor” ( management digital ) este folosit pentru a se referi la practicile de gestionare a ciclului de viață al documentelor electronice și de conservare digitală - pentru acele acțiuni care vizează asigurarea disponibilității acestora în viitor. În același timp, termenul de conservare sau „preservare” în limba engleză este folosit mai des decât termenul de arhivare sau „arhivare”, deoarece acesta din urmă implică păstrarea documentelor fizice în depozitele de materiale existente. Din acest motiv, conservarea este mai des denumită obiecte electronice [23] [24] [25] .
Înființat în 2007, Grupul de lucru al Asociației Bibliotecii Americane a definit arhivarea electronică ca o combinație de strategii, principii și practici care vizează reproducerea fidelă a conținutului autentificat în timp, indiferent de problemele media și schimbările în tehnologiile de stocare. Conceptul se aplică atât documentelor create inițial în format electronic, cât și materialelor digitizate [26] . Cu alte cuvinte, aceasta este activitatea de selectare, stocare și conservare a informațiilor pentru a oferi acces la aceasta pentru generațiile viitoare [27] [28] . Biblioteca Universității Cornell definește arhivarea electronică ca o gamă largă de activități care vizează prelungirea duratei de viață a fișierelor computerizate care pot fi citite de mașină și protejarea acestora împotriva defecțiunilor media, pierderea fizică și învechirea [27] [29] .
Arhivarea electronică urmărește să protejeze și să păstreze informațiile pentru generațiile viitoare [30] [31] [29] . Activitățile de conservare electronică se concentrează pe crearea, întreținerea și păstrarea integrității informațiilor digitale. Crearea implică specificarea unor specificații complete și clare ale fișierelor, producerea de fișiere master fiabile și suficiente metadate descriptive, administrative și structurale pentru a asigura accesul viitor. Întreținerea este documentarea tuturor acțiunilor efectuate asupra fișierelor și urmărirea completă a modificărilor. Conservarea informațiilor implică crearea unei infrastructuri de calcul și de rețea fiabile care să permită stocarea și sincronizarea materialelor pe mai multe site-uri, precum și monitorizarea continuă și dezvoltarea strategiilor de prevenire a pierderii datelor [26] [32] .
În funcție de obiectiv, arhivarea electronică poate fi pe termen lung (accesul este asigurat pe o perioadă nedeterminată), pe termen mediu (acces pe o anumită perioadă de timp) și pe termen scurt (acces la materiale digitale pe o anumită perioadă de timp și / sau până când devine inaccesibil – de exemplu, din cauza schimbărilor de tehnologie) [28] [33] . Există trei componente principale ale infrastructurii arhivării electronice [24] :
În același timp, aspectele tehnologice ale arhivării electronice pot fi împărțite în următoarele grupe [34] :
Deciziile privind necesitatea de a arhiva obiectele digitale se bazează pe o evaluare a valorii lor durabile . Evaluarea este doar una dintre strategii, arhiviștii folosesc și metode de eșantionare statistică și analiză a riscurilor pentru a selecta materialele pentru conservare. Eșantionarea statistică se bazează pe metode statistice pentru a crea un eșantion reprezentativ și pentru a selecta în mod corespunzător documentele pe hârtie și digitale pentru conservare sau digitizare. Metoda de analiză a riscurilor este de a evalua dificultățile potențiale care pot apărea în timpul lucrului cu resurse digitale, precum și consecințele potențiale ale acestora - de exemplu, riscul de învechire a formatului fișierelor și media, riscul pierderilor asociate cu neconservarea resurselor digitale. , si asa mai departe. De regulă, analiza riscului se realizează împreună cu alte criterii de selecție, cum ar fi estimările de cost [35] .
În anii 1980, din ce în ce mai mulți arhiviști au început să acorde atenție faptului că crearea obiectelor digitale și a oricăror înregistrări electronice a fost efectuată fără a ține cont de cerințele pentru păstrarea lor pe termen lung. La începutul anilor 1990, problema învechirii software-ului și, în consecință, imposibilitatea arhivării fiabile a informațiilor create cu ajutorul acestuia a devenit evidentă. Odată cu introducerea arhivării electronice, au apărut primele încercări de reglementare a procesului. Astfel, a fost creat un grup de lucru al proiectului InterPARES, care s-a angajat în dezvoltarea unui model de selecție a obiectelor electronice de arhivat [36] [37] .
Alocați macro și microevaluare. Macroevaluarea este înțeleasă ca selecția documentelor pentru arhivare pe baza importanței contextului – toate resursele create de anumite organizații, actori, sau într-o anumită perioadă de timp vor fi considerate importante și valoroase [35] . Conform modelului dezvoltat de InterPARES, evaluarea contextelor înregistrărilor electronice constă în patru etape principale:
Decizia de arhivare a dosarelor poate fi luată în funcție de contextul juridic-administrativ (sistemul juridic și administrativ în care au fost create materialele), contextul financiar (organul creator, atribuțiile, structura și funcțiile acestuia), contextul procedural (cel procedura de afaceri în timpul căreia sunt create înregistrările), context documentar (structură și relații cu alte documente) sau context tehnologic (componente tehnice ale sistemelor electronice în care sunt create obiecte digitale) [36] .
Arhiviștii colectează și date despre valoarea durabilă și autenticitatea materialelor electronice. Valoarea durabilă a unui obiect este determinată de capacitatea înregistrărilor de a servi interesele sau nevoile creatorilor și ale societății. Poate fi pusă în discuție în cazurile în care conservarea materialelor ar putea fi încălcată. Dacă evaluatorul are motive temeinice să suspecteze că înregistrările și-au pierdut autenticitatea și diferă de versiunea lor originală, atunci arhivarea lor este pusă sub semnul întrebării [36] .
Conform recomandărilor grupului de lucru InterPARES, determinarea posibilității de conservare se realizează în mai multe etape. În primul rând, expertul determină conținutul materialelor și acele elemente tehnice care trebuie păstrate în conformitate cu cerințele de autenticitate. Evaluatorul aliniază apoi aceste cerințe de conservare cu capacitățile organizației responsabile cu păstrarea permanentă a înregistrărilor arhivate [36] .
Pe baza evaluărilor anterioare ale criteriilor, se aplică o decizie de reținere a documentului [36] .
Microevaluarea este de a determina valoarea documentelor individuale. Cel mai important criteriu al acestuia este conformitatea documentului cu politica de colectare a custodelui - din cauza nerespectării acestor criterii, cererea de arhivare electronică poate fi respinsă, chiar și în cazul resurselor valoroase. De exemplu, Earth Resources Observation and Science (EROS) a refuzat accesul la setul de date al programului spațial Apollo de o mie de imagini realizate de NASA în timpul misiunii. În ciuda faptului că filmările au o valoare incontestabilă pentru SUA, EROS a abandonat-o, deoarece majoritatea filmelor au fost filmate de pe o navă spațială sau de pe suprafața Lunii , în timp ce misiunea organizației este de a păstra filmele și fotografiile făcute de pe Pământ. Al doilea cel mai important criteriu de evaluare este valoarea resurselor digitale, care poate fi, de asemenea, primară și secundară. Valoarea primară este înțeleasă ca valori administrative, fiscale și juridice. Valoarea secundară constă în utilitatea, utilitatea și disponibilitatea materialelor. Al treilea criteriu de evaluare este costul, care poate fi un factor decisiv în alegerea mai multor versiuni ale aceluiași material. Arhiviștii țin cont și de fezabilitatea arhivării, întrucât unii conservatori refuză să accepte resurse digitale în anumite formate de fișiere sau medii deoarece nu pot asigura conservarea pe termen lung a materialelor individuale [35] .
Arhivarea electronică se aplică în principal obiectelor create în mediul digital sau digitizate. Prima categorie include date create folosind un fel de tehnologie digitală. Materialele digitizate sunt înțelese ca date convertite din formă analogică în formă digitală prin scanare sau schimbare de format [38] . Cel mai adesea, arhivarea electronică se aplică în legătură cu [27] :
Depozitele electronice sau depozitele de date sunt unul dintre elementele centrale ale arhivării electronice. Arhivele stochează tot felul de obiecte digitale împreună cu metadatele descriptive și administrative asociate. Obiectele digitale pot fi articole dintr-un jurnal electronic, imagini digitalizate ale fotografiilor, date numerice, videoclipuri digitale, versiuni complete ale cărților [32] . Ca parte a mișcării cu acces deschis , depozitele sunt asociate cu calea sau practica „ verde ” de auto-arhivare - autorii materialelor științifice pot plasa în mod independent articole în secțiunea corespunzătoare a arhivei electronice și îi pot oferi o scurtă descriere [39] [40] . Unul dintre primele depozite tematice majore arXiv.org a apărut în 1991. Oferă acces la lucrări științifice din matematică, fizică, informatică, biologie cantitativă . Arhivele permit nu numai accesul la colecțiile de copii electronice ale lucrărilor, ci și adaugă automat publicații la baza de date Citebase , care asigură monitorizarea indexului de citări [41] .
Arhivele pot fi instituționale, disciplinare (sau tematice) sau naționale. Arhivele tematice oferă acces la literatură în una sau mai multe domenii, în timp ce depozitele instituționale stochează lucrări lansate în cadrul aceleiași instituții - de regulă, acestea sunt rapoarte tehnice, disertații, baze de date, articole, publicații tipărite. Un exemplu de depozite instituționale este DSpace al MIT [42] . Arhivele separate au fost create ca urmare a colaborării cu publicații științifice majore - de exemplu, Springer Nature sprijină serviciul In Review, iar Elsevier sprijină ChemRN. De asemenea, sub auspiciile Centrului non-profit pentru Știință Deschisă , există o serie de depozite naționale, inclusiv Arabirxiv ( preprints din țări arabe), Frenxiv ( server francez ), INArxiv ( Indonezian ), Indiarxiv ( Indian ). De asemenea, preprinturile țărilor din America Latină sunt publicate în depozitul SciELO [43] [44] .
Organizațiile folosesc pachete software open source pentru a crea și implementa depozite instituționale. Acestea includ Eprints și DSpace . Lansat în 2002, DSpace este o aplicație de depozit universală open source dezvoltată în comun de HP Labs și Massachusetts Institute of Technology Libraries pentru organizații de cercetare multidisciplinare. DSpace folosește standardul adecvat de metadate Dublin Core pentru a descrie obiectele digitale și, de asemenea, acceptă Open Archives Initiative Protocol for Metadata Harvesting [44] . Alte arhive importante includ PubMed , fondată în 1996, unde sunt publicate lucrări în medicină și biologie, PhilSci-Arhive cu lucrări de filosofie și Social Science Research Network (SSRN), care a postat lucrări în științe sociale și umaniste. din 1994. [40] . Una dintre cele mai mari arhive cu acces deschis este Arhiva de Integrare Europeană , înființată în 2003. Site-ul publică documente ale Uniunii Europene , care sunt destinate distribuirii publice. În ianuarie 2016, arhiva conținea peste 41.800 de documente UE și aproximativ 7.300 de lucrări private [45] . Un număr de țări au implementat inițiative naționale pentru a oferi suport de infrastructură pentru depozite, cum ar fi proiectul SHERPA în Marea Britanie , DARE în Țările de Jos și proiecte guvernamentale australiane în valoare de 12 milioane USD pentru promovarea depozitelor. Organizațiile individuale pot, de asemenea, să achiziționeze servicii care vor oferi acces la resurse cloud unice. Deci, Amazon oferă mai multe servere cloud simultan, inclusiv Amazon S3 pentru găzduirea fișierelor [46] .
În același timp, sunt dezvoltate sisteme care caută mai multe depozite simultan. Un exemplu de astfel de sistem este OAIster , prin care puteți vizualiza informații despre mai mult de 200 de depozite [47] [48] [42] . OpenDOAR caută în conținutul a aproape 3000 de depozite listate public din întreaga lume [49] .
Unul dintre standardele principale care guvernează metadatele este Dublin Core (DCMES), al cărui set principal constă din 15 caracteristici [50] :
Dublin Core este un standard comun pentru catalogarea obiectelor. Cu toate acestea, din cauza naturii generale a DCMES, poate fi dificil să se descrie obiecte complexe de colecție. Din acest motiv, în majoritatea cazurilor Dublin Core este combinat cu alte standarde [51] .
Integritatea și rezistența sunt caracteristici esențiale ale obiectelor digitale arhivate. Integritatea se referă la menținerea acurateței și fiabilității datelor pe tot parcursul ciclului de viață. Poate fi rupt în timpul transferului de date sau al replicării. Menținerea integrității este una dintre cele mai importante sarcini ale arhivării electronice [52] [53] . Persistența înseamnă că fișierul rămâne neschimbat în timpul procesului de arhivare electronică și că se păstrează în forma în care a fost creat [54] .
Standardul internațional PREMIS definește metadatele ca „informații pe care un depozit le folosește pentru a sprijini procesul de conservare digitală”. Metadatele sunt informații despre date, cum ar fi o descriere a formatului fișierului, software-ul și istoricul modificărilor. În mod ideal, metadatele ar trebui să fie colectate și actualizate pe tot parcursul ciclului de viață al unui obiect digital [55] . Rolul principal al metadatelor este de a identifica, descrie și oferi acces inteligent la conținutul unei colecții digitale. Sunt necesare diferite tipuri de metadate pentru a descrie resurse, a descoperi, a prelua, a utiliza, a reprezenta și a păstra obiecte digitale. Cele mai importante metadate sunt pentru organizarea colecțiilor cu materiale vizuale, sonore și de animație care sunt greu de identificat fără o descriere textuală. Există mai multe tipuri de metadate [24] :
Unul dintre standardele principale care guvernează metadatele este Dublin Core (DCMES), al cărui set principal constă din 15 caracteristici [50] :
Dublin Core este un standard comun pentru catalogarea obiectelor. Cu toate acestea, din cauza naturii generale a DCMES, poate fi dificil să se descrie obiecte complexe de colecție. Din acest motiv, în majoritatea cazurilor Dublin Core este combinat cu alte standarde [51] .
Un alt standard fundamental este VRA Core. Spre deosebire de DCMES, VRA Core vă permite să clasificați operele de artă (sau obiectele originale) și surogatele acestora (imaginile digitale) în diferite categorii. Această soluție vă permite să creați o descriere mai precisă a obiectelor și, de exemplu, să indicați data creării ambelor lucrări - lucrarea originală și fotografia acesteia [51] .
Metadate de conservare: Strategii de implementare sau PREMIS a fost dezvoltat de grupul de lucru OCLC și RLG în 2005. Standardul definește unitățile de metadate necesare pentru stocarea fișierelor în depozite. Pentru 2021, PREMIS este menținut și sponsorizat de Biblioteca Congresului . Standardul constă din două părți principale - modelul de date și dicționarul. PREMIS definește mai multe tipuri de metadate, inclusiv descriptive, structurale, tehnice și administrative. Dicționarul pune mare accent pe documentarea originilor digitale (istoria unui obiect) și a relațiilor, în special între diferitele obiecte digitale din depozite [24] . Conform standardului PREMIS, depozitele ar trebui să ajusteze automat metadatele pentru fiecare obiect electronic individual și să păstreze un istoric al modificărilor într-un fișier [56] [57] .
Principiile de bază ale arhivării electronice a datelor au fost formulate într-un număr de standarde și inițiative de la sfârșitul anilor 1990 și începutul anilor 2000.
În 1994, organizația non-profit Commission on Preservation and Access (CPA), împreună cu consorțiul de biblioteci Research Libraries Group , a inițiat o comisie specială ale cărei activități au vizat identificarea practicilor de arhivare pe termen lung a documentelor electronice și elaborarea de recomandări adecvate. Un alt obiectiv al comisiei de lucru a fost dezvoltarea unor practici alternative de arhivare – în loc de a transfera date pe versiuni noi ale aceluiași suport acceptat la acea vreme, membrii comisiei au propus utilizarea metodei de migrare și mutarea obiectelor electronice pe noi hard disk-uri și software. În mai 1996, un grup de 21 de membri prezidat de Donald Waters și John Garrett a lansat raportul final, Preserving Digital Information. Raportul conținea două recomandări principale - implicarea și desemnarea creatorilor de conținut în practicile de arhivare electronică și necesitatea creării unei rețele de arhive electronice fiabile și certificate [58] . Acest document a devenit baza pentru recomandările practice ulterioare pe această temă [59] [34] . În 1997, Consiliul pentru Bibliotecă și Resurse Informaționale [60] a fost creat ca urmare a cooperării dintre CPA și RLG .
RLG a implementat mai multe inițiative practice pentru a pune în practică principiile principale ale raportului. Unul dintre acestea a fost Studies in Scarlet, un proiect realizat în colaborare cu Harvard Law School Library pentru a păstra dosare din America, Marea Britanie și Irlanda din 1815 până în 1914 privind violența domestică , bigamie , încălcarea promisiunii de căsătorie, tutelă , viol și crimă. [61] . Un alt proiect major a fost Global Immigration Project, care a digitalizat cazurile de imigrare. Ambele proiecte au fost dedicate digitizării și conservării datelor, totuși, logica conservării în ambele cazuri a fost diferită. Astfel, arhivarea documentelor pentru proiectul Studii în Stacojiu a izvorât din necesitatea punerii în practică a principiilor de bază ale RLG privind infrastructura depozitelor, iar în cazul Proiectului Global Imigrare, din necesitatea de a digitiza și pune la dispoziție imigrația- colecții aferente care se deteriorau rapid în calitate. Modelele organizatorice ale proiectelor au fost, de asemenea, diferite. Studiile în Scarlet au avut un model centralizat - toate materialele au fost trimise împreună, iar arhiva proiectului de imigrare a constat dintr-o serie de colecții disparate deținute la 11 instituții participante din SUA, Marea Britanie și Canada . În același timp, RLG a lansat proiectul Arches, axat pe crearea unui depozit online de resurse digitale și a unui mediu software pentru acces internațional la materiale de arhivă [62] . Arches este o platformă software open source dezvoltată în colaborare cu Getty Conservation Institute și World Monuments Fund pentru a fi utilizată de instituțiile de conservare din întreaga lume. Arches oferă informații despre situri arheologice, clădiri și structuri, peisaje culturale, ansambluri urbane [63] [64] .
Abordările și soluțiile moderne în domeniul arhivării electronice se bazează pe conceptele și modulele funcționale formulate în standardul internațional OAIS [65] . În 1990, la solicitarea Organizației Internaționale de Standardizare (ISO), Comitetul Consultativ Internațional pentru Sisteme de Date Spațiale a început să elaboreze standarde oficiale pentru arhivarea electronică pe termen lung a informațiilor generate în timpul misiunilor spațiale. În 1995, au avut loc o serie de seminarii internaționale, care au avut ca rezultat lansarea Modelului de referință Open Archival Information System (OAIS). Prima versiune a fost publicată în 1997, iar cea finală în 2002 (actualizată în 2012). OAIS a fost primul sistem care a descris conceptul de pachet de arhivă și obiecte digitale. Ulterior, standardul a devenit un prototip pentru viitoarele proiecte privind crearea de depozite electronice , accesul la bazele de date existente și metadate [58] . În 2003, OAIS a fost aprobat ca standard internațional ISO 14721:2003 „Sisteme de transmisie de date și informații pentru spațiul cosmic. Sistem deschis de informații arhivistice. Model de referință” (Sisteme de transfer de date și informații spațiale - Sistemul de informații arhivistic deschis - Model de referință (OAIS)) [66] . Standardul a fost primul care a introdus un vocabular neutru pentru a descrie rolurile și responsabilitățile actorilor în menținerea depozitelor și reglementarea accesului utilizatorilor [34] . Astfel, standardul OAIS a definit și a informat dezvoltarea unui program durabil de conservare digitală prin furnizarea unui vocabular comun, model de informații și arhitectură de conservare digitală la nivel înalt [67] . OAIS se bazează pe trei concepte principale - „mediu OAIS”, „informații OAIS”, „interacțiuni externe OAIS”. Prima categorie este formată din „Producători”, „Consumatori” și „Manageri” din mediul din jurul arhivei OAIS. Producătorii pot fi atât persoane fizice care furnizează date pentru încărcare în sistem, cât și sisteme. Managerii sunt acei actori care nu participă la funcționarea de zi cu zi a arhivei, dar influențează politica generală a OAIS. Alte arhive OAIS, sau sisteme care nu sunt conforme cu OAIS, pot interacționa cu arhiva OAIS ca „producători” sau „consumatori” [68] .
Conform OAIS, pachetul de informații al unui obiect arhivat ar trebui să includă următoarele informații [69] [66] :
De asemenea, modelul de referință OAIS descrie trei tipuri de pachete de informații [69] [66] :
În 2000, RLG și Online Computer Library Center (OCLC) au început să colaboreze pentru a crea un Trusted Digital Repository (TDR sau Trusted Electronic Repositories ) bazat pe standardul internațional OAIS. Raportul proiectului a fost lansat în august 2001. Potrivit documentului, grupul de lucru RLG și OCLC propune crearea unor sisteme naționale și internaționale de depozite electronice care vor fi responsabile pentru asigurarea accesului la patrimoniul public, social, economic, cultural și intelectual. Conform recomandărilor raportului, activitățile RLG, OCLC și ale altor organizații ar trebui să vizeze dezvoltarea certificării depozitelor electronice, studierea și crearea de instrumente pentru identificarea atributelor importante ale materialelor digitale pentru conservare; cercetare și dezvoltare de modele pentru rețele colaborative și servicii de depozit [58] [70] . Odată cu această definiție, au fost date principalele caracteristici ale TDR - responsabilitatea administrativă, viabilitatea organizațională, stabilitatea financiară, compatibilitatea tehnologică și procedurală și securitatea sistemului [58] .
Un depozit digital de încredere este unul a cărui misiune este de a oferi acces de încredere, pe termen lung, la resursele digitale gestionate unei comunități specificate acum și în viitor [34] .
În 2003, Research Library Group a format un grup de lucru comun cu Administrația Națională a Arhivelor și Arhivelor din SUA pentru a dezvolta criterii specifice pentru certificarea arhivelor electronice. În 2005, RLG și Centrul pentru Biblioteci de Cercetare au început să testeze în practică principiile de bază, iar doi ani mai târziu, pe baza rezultatelor cercetării, au lansat documentul Trustworthy Repositories Audit & Certification , care a stat la baza a Standardului ISO 16363 și a definit principiile de bază pentru crearea și gestionarea depozitelor digitale.documente [71] .
În 2012, în Statele Unite a fost creată comunitatea Digital Preservation Network (DPN), care includea aproximativ 60 de organizații care s-au reunit pentru a împărtăși tehnologie, expertiză și resurse financiare pentru a crea un serviciu de arhivare electronică transparent și pe termen lung. Calitatea de membru al organizației non-profit DPN a fost disponibilă numai pentru organizațiile din SUA interesate de păstrarea pe termen lung a informațiilor electronice [71] . Când s-au alăturat DPN, au fost incluși într-o rețea de stocare partajată care funcționează prin intermediul a cinci depozite majore: Academic Preservation Trust (APTrust), Chronopolis, HathiTrust , Stanford Digital Repository (SDR) și University of Texas Digital Repository (UTDR). Fiecare depozit era considerat un „nod” în rețeaua organizațiilor DPN, situat în diferite părți ale SUA și avea propria arhitectură, platformă hardware și structură organizațională/financiară. Activitățile DPN au vizat crearea unui sistem durabil de stocare a materialelor [72] . În 2018, DPN a fost desființat [73] .
Proiectul InterPARES este o serie de colaborări internaționale care se desfășoară din 1994 sub denumirea de Proiect UBC. Proiectul a fost inițiat de Universitatea din Columbia Britanică în cooperare cu Departamentul de Apărare al SUA și Administrația Națională a Arhivelor și Arhivelor din SUA în 1994-1997. Scopul său principal a fost dezvoltarea unei metodologii de arhivare electronică care să permită păstrarea materialelor într-o formă autentică pentru o perioadă lungă de timp [74] . În 1999, InterPARES a fost creat pe baza Proiectului UBC, condus de cercetătorii Luciana Duranti și Terry Eastwood . Prima fază a proiectului (1999-2001) a fost dedicată păstrării pe termen lung a înregistrărilor create și menținute în baze de date și sisteme de management al documentelor. În cea de-a doua fază a proiectului (2002-2007), cercetătorii au analizat înregistrări realizate în cadrul activităților științifice, artistice și guvernamentale. La a treia etapă a proiectului (2007-2012), cunoștințele practice dobândite au fost testate în instituții arhivistice mici și mijlocii. Ultima etapă (2013-2018) a fost dedicată înregistrărilor electronice încărcate pe Internet de către utilizatorii înșiși [75] [76] . Proiectul a dus la crearea standardului DOD 5015.2 pentru un sistem de evidență [71] [74] .
În 2002, Departamentul de Conservare Digitală al Arhivelor Naționale ale Marii Britanii a creat PRONOM - un registru tehnic care conține informații despre formatele de fișiere , software-ul și componentele tehnice ale depozitelor. Registrul este actualizat în mod constant, iar cercetătorii care lucrează cu formate de fișiere rare și proprietare pot depune cereri. Inițial, PRONOM a fost considerat o resursă internă a Arhivelor Naționale ale Marii Britanii, dar ulterior a fost transformat într-un portal internațional deschis [56] [77] .
Din 1996 până în 2010, Biblioteca Națională a Australiei a condus proiectul Preserving Access to Digital Information (PADI) pentru a promova strategii și linii directoare pentru arhivarea și accesarea obiectelor digitale de către toate instituțiile de patrimoniu cultural din Australia . Ca urmare a proiectului, a fost creat un portal tematic comun, prin care instituțiile puteau face schimb de informații în mod liber, precum și accesul la resursele electronice necesare [56] .
În decembrie 2000, Congresul SUA a alocat 100 de milioane de dolari pentru a crea Programul național de conservare și infrastructură a informațiilor digitale (NDIIPP), care a fost transferat Bibliotecii Congresului . Banii au fost alocați eforturilor naționale de planificare pentru arhivarea pe termen lung a înregistrărilor electronice și colaborarea cu reprezentanții altor organizații federale, de cercetare, biblioteci și de afaceri [78] .
În octombrie 2011, în cadrul conferinței internaționale „Conservarea informațiilor electronice în societatea informațională: probleme și perspective” de la Moscova , a fost adoptată o declarație privind conservarea informațiilor digitale, care a devenit ulterior unul dintre documentele fundamentale în domeniu. de arhivare electronică [79] . Declarația a conturat domenii prioritare pentru conservarea informațiilor digitale și a emis o serie de propuneri pentru ca UNESCO, statele naționale și structurile guvernamentale să introducă practici de digitizare a documentelor [80] .
Metoda de conservare a datelor digitale este de a lucra cu materiale în formate originale și pe suporturi originale, folosind tehnologia originală sau hardware și software utilizat anterior. În acest caz, sunt create așa-numitele „muzee de computer”, unde vizualizarea și conținutul materialelor sunt menținute în formatul original și cu funcționalitate originală. Conservarea a fost menționată ca o strategie de arhivare electronică temporară, deși pentru unele date digitale, metoda este cea mai bună soluție datorită capacității sale de a păstra instrumentele originale de acces, cum ar fi software-ul [65] [81] [82] . Pe termen lung, strategia este problematică din cauza potențialelor probleme de întreținere și a costului de păstrare a anumitor tipuri de fișiere disponibile. Conservarea limitează și portabilitatea unei resurse, care în acest caz depinde direct de echipamentul depozitat în anumite locuri [81] .
EmulareEmularea se referă la reproducerea funcționalității sistemului pentru a asigura funcționarea cu formate de date vechi. Emularea presupune crearea unei mașini virtuale pe un computer care vă permite să reproduceți funcționalitatea mediului hardware și software original [65] . În anumite privințe, emularea este similară cu o strategie de conservare prin faptul că implică păstrarea programului de aplicație original. Scopul emulării este de a păstra aspectul unui obiect digital, precum și funcționalitatea acestuia prin copierea conținutului tehnic al resursei și utilizarea obiectului original sau a unei copii actualizate a obiectului original în viitor [81] . Software-ul de emulare a fost dezvoltat de pasionații de jocuri pentru PC încă de la începutul anilor 1990, dar de la începutul anilor 2000 a atras și interesul în comunitatea de conservare digitală. În ciuda faptului că inițial emularea a fost considerată ca un sistem complex tehnologic, în plus, greu de reprodus, treptat metoda a devenit una dintre principalele în domeniul arhivării electronice - noi dezvoltări, inclusiv introducerea emulatorului direct în plugin -ul browserului , a simplificat foarte mult utilizarea. Emulatorul este programat pentru a imita comportamentul platformelor hardware mai vechi și al software-ului sistemului de operare, cum ar fi jocurile și fișierele. Cu toate acestea, această strategie nu implică păstrarea hardware-ului moștenit și a software-ului original. Un exemplu este Java Virtual Machine [81] [83] . Emularea se aplică atât aplicațiilor și sistemelor de operare, cât și platformelor hardware [84] .
Există mai multe avantaje ale utilizării emulării pentru a accesa formatele de fișiere și software-ul vechi. Acestea includ capacitatea de a accesa obiecte digitale complexe, inclusiv jocuri, realitate virtuală și aplicații. Permițând utilizatorilor să interacționeze cu obiectele digitale în mediul lor original, emularea oferă cercetătorilor un context valoros despre mediul în care creatorul lucra în acel moment. Când este utilizat la scară, poate oferi acces la porțiuni mari ale unei colecții [83] . Cu toate acestea, utilizarea emulării este complicată de potențiale probleme legale - termenii de licențiere pentru software-ul și sistemele de operare vechi nu permit întotdeauna emularea, deoarece această metodă implică copierea. Alegerea emulării ca strategie de arhivare electronică poate duce, de asemenea, la o dependență de învechirea emulatorilor și, în timp, sugerează limitări datorate pierderii de putere a echipamentelor [82] .
ÎncapsulareMetoda de încapsulare presupune includerea unei descrieri tehnice a documentului în compoziția obiectului digital în sine, reducând astfel dependența acestuia de mediul extern, întrucât această informație permite fie reproducerea mediului original, fie transferul documentului într-unul nou . 65] [85] . În majoritatea metodelor de stocare a informațiilor utilizate, diferite componente electronice de date sunt stocate în locuri diferite (de exemplu, într-o bază de date sau într-un sistem de fișiere) ca parte a diferitelor obiecte digitale. Relațiile dintre diferitele componente sunt prin legături, pointeri și nume de fișiere. Cu toate acestea, dezvoltarea rapidă a tehnologiei informației necesită ca relația dintre obiectele digitale să fie mai stabilă - stocarea separată a componentelor unei înregistrări electronice este întotdeauna plină de riscuri și, de îndată ce relația este ruptă și nu poate fi restaurată, înregistrarea este considerată. pierdut. Arhivistul poate evita acest risc prin includerea metadatelor în fișierele computerizate care conțin documente. Când se combină două componente într-un singur obiect fizic, legătura dintre înregistrare și metadate nu poate fi pierdută [86] . Încapsularea poate fi aplicată resurselor digitale al căror format este bine definit și utilizat pe scară largă [81] . De asemenea, această strategie depășește problema uzurii tehnologice a formatelor de fișiere, deoarece metadatele includ o modalitate de a crea o aplicație originală pentru accesul la aceasta pe platforme informatice mai avansate [87] [81] .
Standardul internațional OAIS descrie, de asemenea, tipurile de informații auxiliare care ar trebui incluse într-un fișier încapsulat - origine (pentru a descrie sursa unui obiect), context (pentru a descrie modul în care un obiect se raportează la alte informații din afara „containerului”), o referire la unul sau mai mulți identificatori (pentru a identifica unic un obiect) [81] .
MigrațieMetoda de migrare este de a transfera documente electronice pe alte medii sau pe alt sistem de operare - de exemplu, de pe o bandă magnetică pe un CD. Această strategie este una dintre cele mai populare practici în arhivarea electronică, deoarece păstrează integritatea materialului digital și capacitatea utilizatorilor de a găsi și utiliza informații fără a fi afectați de tehnologiile învechite [81] [88] [82] .
Standardul internațional OAIS distinge patru tipuri principale de migrare: actualizare, replicare, reambalare și transformare. Actualizarea asigură păstrarea unei copii de încredere a fluxului de biți , în timp ce replicarea și reambalarea asigură că pachetul gestionat al obiectului este disponibil [81] . Această strategie vizează păstrarea conținutului obiectului transferat, în timp ce unele proprietăți tehnologice pot fi pierdute [81] [89] [90] .
Arheologie digitalăArheologia digitală este o metodă costisitoare de arhivare a materialelor, care constă în salvarea acelor obiecte digitale devenite inaccesibile din cauza învechirii tehnologice și/sau a degradării fizice. Din cauza costului ridicat și a lipsei de garanții pentru restabilirea întregii completitudini a datelor, utilizarea unei astfel de strategii este considerată o măsură necesară [82] [65] .
ActualizareO strategie de actualizare implică transferul de informații de pe un mediu durabil pe altul, de exemplu, de la o bandă DAT de 4 mm în descompunere la o bandă DAT nouă de 4 mm sau de la un CD-RW vechi pe un CD-RW nou. Actualizarea este o componentă necesară a oricărui program de arhivare electronică de succes, dar nu este o strategie în sine. Metoda rezolvă problema uzurii și învechirii media, dar nu este considerată o metodă de arhivare durabilă pe termen lung [82] [91] [27] .
Arhivarea site-uluiArhivarea web este procesul de colectare, conservare și extragere de site-uri web și materiale de pe Internet pentru a le plasa într-o arhivă electronică pentru accesul generațiilor viitoare. Această strategie are ca scop depășirea problemei pierderii de informații pe Internet din cauza dinamicii rețelei și a modificărilor condițiilor de licențiere. Una dintre cele mai mari și mai celebre inițiative de arhivare web a fost Internet Archive non-profit , fondată în 1996 . Colecția Arhivă constă din multe sub -colecții de site-uri web arhivate , cărți digitalizate, fișiere audio și video, jocuri și software. În 2001, Arhivele au lansat Wayback Machine , un serviciu dedicat păstrării unei mari părți a internetului „deschis”. Utilizatorii Wayback Machine pot urmări modificările care au loc pe site-urile selectate și pot compara diferite versiuni ale editărilor. În august 2021, Wayback Machine a oferit acces la peste 581 de miliarde de pagini web salvate [92] [93] [82] [94] .
Organizațiile pot utiliza programe selective de arhivare web. Cele mai mari dintre aceste servicii includ PANDAS (PANDORA Digital Archiving System), inițiat de Biblioteca Națională Australiană. PANDAS este o aplicație web scrisă în Java și Perl care oferă o interfață pentru a gestiona procesul de arhivare web. Un rol similar îl joacă The Web Creator Tool, un instrument de flux de lucru open source pentru gestionarea arhivării web selective, dezvoltat în comun de Biblioteca Națională din Noua Zeelandă și Biblioteca Britanică cu Oakleigh Consulting [95] .
Strategie | Avantaje | Defecte | Aplicație |
---|---|---|---|
Conservare | Mentine aspectul. Vă permite să lucrați cu formate și software originale. | Costul ridicat de întreținere a fișierului. Securitatea depinde de echipament. | Fișiere cu formate învechite, software, resurse al căror aspect contează. |
Emulare | Mentine aspectul. | Complexitatea creării unui emulator. O mulțime de informații de stocat. Accesul la informații necesită software arhaic. | Software; resurse digitale complexe (de exemplu, care conțin fișiere executabile); resurse, a căror valoare este necunoscută și a căror utilizare este puțin probabilă în viitor; resurse al căror aspect contează. |
Încapsulare | Stochează informații despre fișier și despre cum poate fi redat. | Cunoștințele despre fișier și despre sistemul său de redare sunt păstrate. | Resurse inaccesibile și resurse cu formate cunoscute. |
Migrația | Nu necesită salvarea aplicațiilor originale. Suportă acces și control activ. | Cost ridicat pentru conservarea pe termen lung. Lipsa capacității de salvare a metadatelor. Nevoia de actualizare constantă și de lucru din partea arhiviștilor. | Resurse care sunt accesate și gestionate în mod activ, cum ar fi datele științifice sau bazele de date. Resurse cu formate utilizate în mod obișnuit. |
Arheologie digitală | Vă permite să reconstruiți obiecte electronice, la care accesul a fost pierdut. | Cost ridicat și fără garanții pentru recuperarea fișierelor. | Fișiere care s-au pierdut. |
Actualizați | Abordează problema uzurii și a uzurii media. | Metoda este eficientă doar ca soluție pe termen scurt. | Resurse ale căror mass-media riscă să devină învechite. |
Arhivare web | Rezolvă problema pierderii de informații pe Internet din cauza dinamicii dezvoltării rețelei și a modificărilor condițiilor de licențiere. | Potențiale complicații juridice legate de legea dreptului de autor. | Toate fișierele și site-urile găsite pe Internet și considerate demne de arhivare de către actorul conservator. |
Pentru a implementa eficient practicile de arhivare electronică, organizațiile sunt încurajate să implementeze și schimbări structurale. Astfel, pentru a reduce efectul negativ al învechirii tehnologice asupra mediilor digitale, este necesară adoptarea și respectarea standardelor internaționale care reglementează aspectele legate de adoptarea de software și reducerea dependenței de actualizările dezvoltatorilor de software. Standardele deschise pentru conservarea și arhivarea digitală sunt stabilite de organisme oficiale de standardizare și de consorții internaționale, inclusiv Alianța Națională pentru Administrarea Digitală (NDSA), Consorțiul World Wide Web (W3C), Organizația Internațională pentru Standardizare și Consorțiul Internațional pentru Conservarea Internetului (IIPC). NDSA a fost fondată în 2010 și este un consorțiu de organizații dedicate conservării pe termen lung a informațiilor digitale. Consorțiul World Wide Web este activ din 1994 și este o comunitate internațională ale cărei organizații membre lucrează pentru a dezvolta standarde web. Fondată în 2003 la Bibliothèque nationale de France, IIPC are implicate mai multe organizații, inclusiv Biblioteca Națională a Chile și Biblioteca Congresului, care dezvoltă standarde și instrumente pentru arhivarea web [82] .
Păstrarea materialelor digitale necesită investiții semnificative în infrastructura tehnologică care va sprijini activitățile de arhivare digitală. Pentru a asigura păstrarea pe termen lung a informațiilor, este necesară selectarea corectă a suporturilor de date utilizate, ceea ce va permite accesul la informații pentru o perioadă lungă de timp. De exemplu, din anii 2000, utilizarea mediilor magnetice și optice nu a fost considerată justificată. Criteriile de selecție a mass-media ar trebui să includă analize pe probleme precum învechirea, standardizarea, costul. Începând cu anii 2010, sistemele de stocare locale sau cloud persistente au fost populare [82] .
Implementarea cu succes și pe termen lung a practicilor de arhivare electronică necesită o colaborare îmbunătățită între organizații, echipe de profesioniști și creatori de obiecte digitale. Pentru a face acest lucru, există consorții internaționale, rețele tematice de organizații și software open source - de exemplu, Open Journal Systems și DSpace [82] .
Din punct de vedere al conservării digitale, fiecare e-mail, constând dintr-un antet, corp de mesaj și atașamente, este un pachet de comunicare complex care conține material sursă unic, adesea cu potențială valoare istorică, juridică și administrativă [96] . Schimbul de e-mailuri reprezintă o parte semnificativă a traficului pe Internet, dar este relativ rar să devină parte a programelor de arhivare electronică. De exemplu, Biblioteca Congresului din SUA colectează o arhivă de tweet -uri publice din întreaga lume, Arhiva Web din Regatul Unit, Arhiva Internet și Fundația Internet Memory au fost implicate în păstrarea paginilor web și în colectarea de informații de pe site-uri; cu toate acestea, niciunul dintre proiecte nu colectează informații transmise prin e-mail [97] . Principalele motive pentru aceasta sunt confidențialitatea potențială a e-mail-urilor, diferențele între formatele clientului de e-mail și lipsa unui format standardizat pentru stocarea mesajelor [97] [98] [96] .
Există o serie de proiecte de arhivare a e-mailurilor:
Începând din 2012, arhiva Carcanet Press , deținută de Biblioteca Universității din Manchester , a început să stocheze corespondența electronică cu poeți, critici, editori, traducători și artiști celebri. Proiectul de conservare a e-mailurilor de presă Carcanet a folosit atât metode tradiționale de arhivare, cât și noi standarde pentru conservarea digitală:
Din 1999 până în 2003, ca urmare a cooperării dintre Arhivele Orașului Anvers și Centrul Interdisciplinar de Drept și Informatică al KU Leuven , proiectul DAVID a fost activ. Scopul acestui proiect a fost crearea unui manual pentru arhivarea electronică. Personalul a revizuit cerințele legale și de arhivare pentru arhivarea e-mailurilor și a indicat câteva strategii posibile de arhivare. Pe lângă valoarea sa teoretică, raportul a fost important prin aceea că după ce a început implementarea practicilor de gestionare a înregistrărilor și de păstrare a evidenței e-mailurilor și a documentelor electronice aferente [99] .
Arhivele Instituției Smithsonian au fost printre primele organizații care au dezvoltat practici de conservare a e-mailurilor. În colecțiile sale, Arhiva păstrează înregistrări de e-mail care datează din anii 1980 și sunt create cu ELM . De atunci, Smithsonian a folosit o varietate de aplicații și formate de e-mail, inclusiv PINE, cc:Mail , Lotus Notes , GroupWise și alte aplicații. Angajații Smithsonian au primit ordin să imprime poșta electronică pentru păstrarea evidențelor, așa cum era practica la acea vreme în alte organizații și afaceri. Întrucât la acea vreme practic nu existau organizații care să lucreze în domeniul stocării datelor de e-mail, în 2005 a fost creat un proiect specializat în colaborare cu Rockefeller Archive Center - Collaborative Electronic Records Project (CERP). Proiectul a durat trei ani și a avut ca rezultat crearea unor standarde și practici pentru arhivarea comunicațiilor electronice [100] [99] .
De la începutul anului 2008, la Universitatea Harvard funcționează un grup de lucru pentru a defini strategii de conservare a mesajelor electronice. În 2015, pe baza sa, a fost lansat EAS, un proiect de parteneriat între Oficiul Bibliotecii pentru Sisteme Informaționale (OIS) al Universității Harvard și o serie de organizații curatoriale din diviziile bibliotecii Harvard [101] . EAS colaborează cu Wordshack pentru a automatiza procesul de salvare a datelor. De exemplu, mesajele de e-mail și atașamentele selectate pentru stocarea pe termen lung sunt trimise automat către DRS, Serviciul de depozitare electronică al Universității Harvard [101] .
XENA este un software gratuit și open source dezvoltat de Arhivele Naționale din Australia pentru păstrarea pe termen lung a înregistrărilor electronice. Funcția principală a XENA este de a determina formatul de fișier al înregistrărilor digitale și de a-l converti în formatul adecvat pentru conservare pe baza standardelor deschise . Software-ul Xena contribuie la conservarea digitală prin realizarea a două sarcini importante: definirea formatelor de fișiere cu obiecte digitale și conversia acestora în formate deschise pentru conservare [102] .
Conservarea jocurilor video se realizează prin arhivarea dezvoltărilor codului sursă , a copiilor digitale ale jocurilor video, a emulării consolelor de jocuri , întreținerea și păstrarea hardware-ului specializat pentru jocuri video și prin digitalizarea revistelor și cărților tipărite pre- digitale de jocuri video . Conservarea jocurilor video permite nu numai explorarea istoriei industriei, ci și analizarea aspectelor tehnice și creative ale producției unui anumit joc [103] .
Tehnologia folosită pentru a crea jocuri s-a schimbat semnificativ de la începutul anilor 1990 și, în multe cazuri, jocurile originale ale vremii nu pot fi jucate din cauza învechirii formatului [104] . În același timp, jocurile, de regulă, au fost lansate pentru o anumită consolă, ceea ce a complicat foarte mult conservarea lor ulterioară [105] . Prin urmare, în această perioadă au început să apară inițiative de păstrare a moștenirii jocurilor video. Au fost înființate muzee ale jocurilor de noroc, cum ar fi The Strong din New York [106] , Muzeul de Artă și Divertisment Digital din Auckland [107] , Muzeul Jocurilor de Calculatoare din Berlin [108] , Muzeul de Arcade Sovietică Mașini la Moscova și Sankt Petersburg [109] . A fost fondată și Video Game History Foundation din Statele Unite, dedicată păstrării nu numai a jocurilor, ci și a revistelor, manualelor și materialelor promoționale pe această temă. Alte inițiative majore includ serviciul de distribuție digitală GOG.com și o colecție de emulatori de arcade bazate pe browser la Internet Archive [105] . Din 2015, Națiunile Unite susțin proiectul Open Digital Library on Traditional Games, care are ca scop arhivarea și protejarea electronică a jocurilor tradiționale indigene prin catalogarea și construirea unei baze de date comune din care vor fi create ulterior jocurile video [110] [111] .
Începând cu mijlocul anilor 1990, mișcarea științei deschise a început să se dezvolte în lumea științifică - din ce în ce mai mulți cercetători s-au opus paywall -urilor și costului excesiv de ridicat al accesului la literatura academică pe fondul finanțării reduse pentru biblioteci. Una dintre revendicările susținătorilor mișcării a fost deschiderea accesului la publicațiile științifice, în principal prin publicarea pe Internet [112] [113] . În curând au apărut primele depozite online și biblioteci electronice. Acestea au inclus proiecte atât de mari precum arXiv.org , JSTOR , Public Library of Science (PLoS), BioMed Central [114] . În august 2021, Directory of Open Access Journals listează peste 15.900 de reviste cu acces deschis și peste 5 milioane de articole [115] . În același timp, logica arhivării publicațiilor științifice în fiecare dintre proiecte poate fi foarte diferită. De exemplu, baza de date digitală JSTOR a fost creată în 1995 pentru a stoca copii digitale ale revistelor tipărite. Baza de date include doar acele reviste științifice în care publicarea se realizează printr-un sistem de evaluare inter pares . De asemenea, important este numărul de organizații care se abonează la această revistă și indexul de citări . Arhivarea are loc după principiul „moving wall” (Moving Wall) – problemele sunt plasate în sistem din momentul creării publicației și până la 3-5 ani până în prezent. Conținutul postat pe JSTOR nu este întotdeauna în domeniul public și poate fi ascuns în spatele paywall-urilor . Accesul la astfel de materiale este asigurat printr-un sistem de abonamente instituționale [116] [117] [118] . Creată de Biblioteca Națională de Medicină din SUA, arhiva de literatură biomedicală PubMed Central a fost lansată în februarie 2000. Accesul la materialele postate pe site este gratuit și nelimitat [119] . La rândul lor, pe portalul arXiv.org, lansat în 1991, cercetătorii postează în mod independent preprinturi sau copii distribuite gratuit ale lucrărilor lor publicate în fizică , matematică , astronomie , informatică și alte științe exacte. Articolele nu sunt revizuite de către colegi înainte de publicare , dar sunt verificate inițial de moderatori [120] .
Odată cu apariția bibliotecilor electronice, a apărut și problema stocării pe termen lung a colecțiilor digitale de literatură științifică - asigurarea disponibilității resurselor pentru generațiile viitoare necesită eforturi deosebite și investiții constante [121] [122] . Materialele cu acces deschis, în general, nu încalcă drepturile de autor sau drepturile de proprietate – bibliotecile nu au nevoie de permisiune specială pentru a le păstra. Pentru păstrarea pe termen lung a literaturii cu acces deschis, organizațiile sunt încurajate să urmeze standarde internaționale deschise și să implementeze formate deschise, inclusiv odt și xml [113] .
Una dintre principalele probleme ale arhivării electronice este învechirea tehnologiilor – datorită schimbării și dezvoltării rapide a echipamentelor și formatelor de software, accesul la depozitele electronice se poate pierde [27] . În medie, mediile de stocare devin învechite o dată pe deceniu și sunt înlocuite cu noi modalități mai eficiente de stocare a datelor și, în consecință, noi hardware și software. În același timp, instrumentele media vechi sunt întrerupte. În plus, mediile de stocare sunt supuse erorilor și eșecurilor, atacurilor de viruși și degradării fizice [65] . Pentru arhivarea electronică, organizațiile sunt încurajate să utilizeze formate neproprietate, persistente, care sunt independente de software-ul terților [123] [124] .
Lipsa unei legislații, politici, strategii și conștientizare uniforme în domeniul arhivării electronice complică și practica conservării informațiilor. De exemplu, legiuitorii pot să nu cunoască cerințele pentru arhivarea electronică și, în consecință, legislația poate ignora sau nu reglementa în totalitate conservarea datelor digitale. Acest lucru creează probleme suplimentare în ceea ce privește drepturile de autor [27] . Drepturile de proprietate intelectuală și alte obligații legale pot împiedica copierea, stocarea, modificarea și utilizarea conținutului resurselor digitale pentru conservarea pe termen lung [82] . Problema drepturilor de autor și a drepturilor de proprietate intelectuală pentru materialele digitale este mult mai complexă decât pentru materialele fizice tradiționale. În domeniul arhivării tradiționale, împreună cu o copie fizică, biblioteca sau arhiva a dobândit automat dreptul de copiere și conservare [19] . Cu toate acestea, majoritatea metodelor de arhivare electronică necesită existența și exercitarea drepturilor exclusive asupra operei, inclusiv dreptul de reproducere [125] . Mai mult, editorii pot interzice copierea publicațiilor folosind mijloace tehnice – ceea ce este permis și consacrat de legea dreptului de autor, atât în Statele Unite , cât și în Uniunea Europeană. De asemenea, materialele individuale pot avea mai mulți deținători de drepturi de autor (inclusiv alți editori, autori, artiști, furnizori terți de software), ceea ce poate face dificilă pentru editori să acorde drepturi de conservare bibliotecilor și altor actori. Cu toate acestea, dacă „aspectul și senzația” sau funcționalitatea unei publicații se modifică ca urmare a copierii, autorii și creatorii pot simți că drepturile lor au fost încălcate, poate fi dificil să se dovedească că copiile păstrate ale publicațiilor sunt doar copii și nu complet. versiuni noi [126] . Printre posibilele soluții la această problemă, cercetătorii citează potențiala introducere a acordurilor de licență care precizează în mod specific condițiile de conservare [127] .
Dificultățile includ, de asemenea, factorul uman , virușii informatici, dezastrele naturale, defecțiunile media și software [128] [27] .