Baza de date - o colecție de date stocate în conformitate cu schema de date , a cărei manipulare este efectuată în conformitate cu regulile instrumentelor de modelare a datelor [1] [2] [3] .
Mulți experți subliniază o greșeală comună, constând în folosirea incorectă a termenului „bază de date” în locul termenului „ sistem de management al bazelor de date ”, și subliniază necesitatea de a face distincția între aceste concepte [4] .
Literatura de specialitate oferă multe definiții ale conceptului de „bază de date”, reflectând mai degrabă opinia subiectivă a anumitor autori, dar nu există o formulare unificată general acceptată.
Definiții din documentele de reglementare, inclusiv standarde :
Definiții din monografii autorizate :
Definițiile cel mai adesea (explicit sau implicit) conțin următoarele caracteristici distinctive [10] :
Dintre semnele enumerate, doar primul este strict, în timp ce altele permit interpretări diferite și grade diferite de evaluare. Puteți stabili doar un anumit grad de conformitate cu cerințele pentru baza de date.
Într-o astfel de situație, practica comună joacă un rol important. În conformitate cu acesta, de exemplu, arhivele de fișiere , portalurile de internet sau foile de calcul nu sunt numite baze de date , în ciuda faptului că au într-o oarecare măsură caracteristicile unei baze de date. Este general acceptat că acest grad este insuficient în majoritatea cazurilor (deși pot exista și excepții).
Istoria apariției și dezvoltării tehnologiilor de baze de date poate fi considerată atât sub aspect larg, cât și îngust.
În sens larg, conceptul de istorie a bazelor de date este generalizat la istoria oricăror mijloace prin care omenirea a stocat și prelucrat date. În acest context sunt menționate, de exemplu, mijloacele de contabilizare a vistieriei regale și a impozitelor în Sumerul antic (4000 î.Hr. ) [12] , scrierea înnodată a incașilor - kipu , scrierea cuneiformă care conține documente ale regatului asirian etc. că dezavantajul acestei abordări este estomparea conceptului de „bază de date” și contopirea lui efectivă cu conceptele de „ arhivă ” și chiar „ scriere ”.
Istoria bazelor de date în sens restrâns consideră bazele de date în sensul tradițional (modern). Această poveste începe în 1955 cu introducerea firmware-ului pentru procesarea înregistrărilor. Software-ul de atunci a susținut un model de procesare a înregistrărilor bazat pe fișiere. Cardurile perforate au fost folosite pentru stocarea datelor [12] .
Bazele de date operaționale ale rețelei au apărut la mijlocul anilor 1960 . Operațiunile pe baze de date operaționale au fost procesate interactiv folosind terminale. Organizarea simplă a înregistrărilor index-secvențiale a evoluat rapid la un model de înregistrare mai puternic, orientat spre set. Charles Bachmann a primit Premiul Turing pentru conducerea lucrărilor Data Base Task Group (DBTG), care a dezvoltat un limbaj standard pentru descrierea datelor și manipularea datelor .
În același timp, conceptul de scheme de baze de date și conceptul de independență a datelor au fost dezvoltate în comunitatea de baze de date COBOL .
Următorul pas important este asociat cu apariția modelului de date relaționale la începutul anilor 1970 , datorită lucrării lui Edgar Codd . Munca lui Codd a deschis calea unei legături strânse între tehnologia aplicată a bazelor de date și matematică și logică. Edgar F. Codd a primit, de asemenea , Premiul Turing pentru contribuțiile sale la teorie și practică .
Termenul de bază de date în sine ( în engleză bază de date ) a apărut la începutul anilor 1960 și a fost introdus în uz la simpozioane organizate de SDC în 1964 și 1965 , deși a fost înțeles la început într-un sens destul de restrâns, în contextul sistemelor de inteligență artificială . Termenul a intrat în uz pe scară largă în sensul modern abia în anii 1970 [13] .
Există un număr mare de soiuri de baze de date care diferă în diferite criterii . De exemplu, în „Enciclopedia tehnologiilor bazelor de date” [7] , pe baza căreia este scrisă această secțiune, sunt definite peste 50 de tipuri de baze de date.
Clasificarea după modelul de date include de obicei:
Clasificarea după mediul de stocare face distincție între bazele de date care stochează date în memoria secundară („tradițională”, baza de date convențională engleză ), rezidentă (toate datele din stadiul de execuție sunt în RAM ) și terțiare ( bază de date terțiară engleză ), stocând date pe dispozitive detașabile de stocare în masă - pe bază de benzi magnetice sau discuri optice . În același timp, în toate clasele, într-un fel sau altul, toate mediile de stocare sunt utilizate, de exemplu, pentru bazele de date rezidente, SGBD-ul scrie jurnalele de numai scriere în memoria permanentă , iar pentru bazele de date tradiționale, este folosit un cache în RAM.
De asemenea, bazele de date pot fi clasificate după conținut, de exemplu, pot fi geografice, istorice, științifice, multimedia . Pentru unele forme de conținut, sunt construite SGBD specializate sau sunt adăugate caracteristici specializate unui SGBD cu scop general, printre astfel de baze de date:
În funcție de gradul de distribuție, bazele de date sunt împărțite în centralizate (concentrate; ing. baza de date centralizată ) - complet suportate pe un singur echipament și distribuite ( ing. baze de date distribuite ). Dintre varietatea de opțiuni pentru bazele de date distribuite, se remarcă următoarele:
Sunt posibile opțiuni mixte, de exemplu, pentru aceeași bază de date distribuită, sharding-ul este utilizat pentru obiecte mari, iar replicarea este utilizată pentru obiectele mici.
După modalitățile de organizare a stocării, se pot distinge baze de date ciclice (scriu date noi în loc de învechite), baze de date de streaming .
O bază de date foarte mare ( English Very Large Database, VLDB ) este o bază de date care ocupă o cantitate extrem de mare de spațiu pe un dispozitiv de stocare fizic . Termenul implică volumele maxime posibile ale bazei de date, care sunt determinate de cele mai recente progrese în tehnologiile fizice de stocare a datelor și tehnologiile software de manipulare a datelor.
Definiția cantitativă a conceptului de „volum extrem de mare” variază în timp. Deci, în 1997, cea mai mare bază de date de text din lume a fost Knight Ridder's DIALOG cu un volum de 7 terabytes [14] . În 2001, cea mai mare bază de date era considerată a fi de 10,5 terabytes, în 2003 - 25 terabytes [15] . În 2005, cele mai mari baze de date din lume erau considerate a fi baze de date cu un volum de stocare de aproximativ o sută de terabytes [16] . În 2006, motorul de căutare Google a folosit o bază de date de 850 terabytes [17] .
Până în 2010, se credea că volumul unei baze de date ultra-mari ar trebui măsurat în cel puțin petabytes [16] .
În 2011, Facebook a stocat date într-un cluster de 2.000 de noduri cu o capacitate totală de 21 de petabytes [18] ; până la sfârșitul anului 2012, volumul de date al Facebook a ajuns la 100 de petabytes [19] , iar în 2014 - 300 de petabytes [20] .
Până în 2014, conform estimărilor indirecte, Google a stocat pe serverele sale până la 10-15 exabytes de date în total [21] .
Potrivit unor estimări, până în 2025, geneticienii vor avea date despre genomul a 100 de milioane până la 2 miliarde de oameni, iar stocarea acestei cantități de date va necesita de la 2 până la 40 de exaocteți [22] .
În general, conform estimărilor IDC , cantitatea totală de date din „universul digital” se dublează la fiecare doi ani și se va schimba de la 4,4 zettabytes în 2013 la 44 zettabytes în 2020 [23] .
Cercetarea în domeniul stocării și procesării bazelor de date VLDB foarte mari este întotdeauna în fruntea teoriei și practicii bazelor de date. În special, din 1975, se desfășoară anual Conferința internațională privind bazele de date foarte mari („Conferința internațională privind bazele de date foarte mari”). Majoritatea cercetărilor se desfășoară sub egida organizației non-profit VLDB Endowment (VLDB Endowment Fund), care asigură promovarea muncii științifice și schimbul de informații în domeniul bazelor de date foarte mari și al domeniilor conexe.
Dicționare și enciclopedii | ||||
---|---|---|---|---|
|
Bază de date | |
---|---|
Concepte |
|
Obiecte |
|
Chei | |
SQL |
|
Componente |
Magazin de date | ||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||
| ||||||||||||||
| ||||||||||||||
Categorie |