Manager de blocare distribuit

Versiunea actuală a paginii nu a fost încă revizuită de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită la 3 martie 2017; verificările necesită 13 modificări .

Sistemele de operare folosesc manageri de blocare pentru a organiza și coordona accesul la resurse . Managerul de blocare distribuit ( DLM [1] ) rulează pe fiecare mașină din cluster , cu o copie identică a bazei de date de blocare a clusterului. Astfel, DLM este un pachet software care permite computerelor dintr-un cluster să coordoneze accesul la resursele partajate.

Diverse implementări ale DLM au fost folosite ca bază pentru mai multe sisteme de fișiere cluster de succes, în care mașinile din cluster pot fi folosite pentru a stoca fișierele reciproc folosind un singur sistem de fișiere, cu beneficii semnificative de performanță și disponibilitate. Principalul beneficiu de performanță este atins prin rezolvarea problemei coerenței cache-ului pe disc între computerele participante. DLM este folosit nu numai pentru a bloca fișiere, ci și pentru a coordona toate tipurile de acces la disc. VMS Cluster (numit anterior VAX Cluster ) este primul sistem de clustering care a devenit larg răspândit și se bazează pe VAX/VMS (mai târziu OpenVMS ) DLM în acest fel.

Implementarea VMS

DEC VAX/VMS a fost primul sistem de operare disponibil pe scară largă cu o implementare DLM. Această funcționalitate a fost introdusă în versiunea 4, deși interfața cu utilizatorul a fost aceeași cu managerul de blocare uniprocesor care a fost implementat pentru prima dată în versiunea 3.

Resurse

DLM folosește conceptul generalizat de resursă ca obiect la care accesul trebuie controlat. Acesta poate fi un fișier, o înregistrare, o zonă de memorie partajată sau orice altceva alege dezvoltatorul aplicației . Dezvoltatorul însuși descrie ierarhia resurselor, astfel încât să poată determina numărul necesar de niveluri de blocare. De exemplu, o bază de date ipotetică ar putea descrie ierarhia resurselor după cum urmează:

Bază de date
Masa
intrare
camp

Astfel, procesul din cadrul execuției are posibilitatea de a seta încuietorile necesare asupra bazei de date în ansamblu (resursa părinte), iar apoi asupra părților individuale ale bazei de date (resurse subordonate).

Moduri de blocare

Un proces care rulează în interiorul unui cluster VMS poate obține o blocare a resurselor. DLM implementează șase moduri de blocare și fiecare dintre ele definește diferite niveluri de exclusivitate (compatibilitate) acordate. Pe măsură ce resursa este utilizată, puteți schimba nivelul modului de blocare la un nivel mai înalt sau mai jos. Când toate procesele deblochează resursa, informațiile sistemului despre resursă sunt distruse.

Nulă (NL). Indică interes pentru resursă, dar nu împiedică alte procese să o achiziționeze. Acest mod oferă un mecanism convenabil pentru crearea unei resurse și stocarea valorii de blocare a acesteia . Utilizat de obicei pentru a declara existența unui obiect pe un anumit nod pentru membrii clusterului (membrii clusterului VMS).
Citire paralelă ( Citire concomitentă , CR). Indică intenția de a citi (dar nu de a actualiza) resursa. Acest lucru permite altor procese să citească sau să actualizeze resursa, dar îi împiedică pe alții să obțină acces exclusiv la aceasta. Acest mod este utilizat de obicei pe resurse la un nivel înalt în ierarhie, având în vedere că pot fi obținute blocări mai stricte pe resursele subordonate.
Înregistrare simultană ( scriere simultană , CW). Indică intenția de a citi și actualiza resursa. Acest mod permite și altor procese să citească sau să actualizeze resursa, dar nu le permite altora să aibă acces exclusiv la aceasta. Acest mod este folosit și pe resursele de la un nivel superior în ierarhie, având în vedere că pot fi obținute blocări mai stricte asupra resurselor copil.
Lectură protejată ( Cittură protejată , PR). Acesta este modul tradițional de blocare partajată , care indică dorința de a citi resursa, dar îi împiedică pe alții să-și actualizeze conținutul. Cu toate acestea, alte procese pot citi și conținutul resursei.
Scriere protejată ( PW ). Acesta este modul tradițional de blocare a actualizării , care indică dorința de a citi și actualiza o resursă și împiedică alți utilizatori să o actualizeze. Alte procese pot obține modul de acces „Parallel Read” și pot citi resursa.
Exclusiv (EX). Aceasta este o blocare exclusivă tradițională care permite accesul de citire și actualizare la o resursă și împiedică alte procese să aibă acces la aceasta.

Următorul tabel de adevăr arată compatibilitatea fiecărui mod de blocare cu altele:

modul	NL	CR	CW	relatii cu publicul	PW	EX
NL	da	da	da	da	da	da
CR	da	da	da	da	da	Nu
CW	da	da	da	Nu	Nu	Nu
relatii cu publicul	da	da	Nu	da	Nu	Nu
PW	da	da	Nu	Nu	Nu	Nu
EX	da	Nu	Nu	Nu	Nu	Nu

Obținerea unui blocaj

Un proces poate bloca o resursă punând în coadă (SYS$ENQ) o solicitare de blocare. Aceasta este similară cu Queue IO , o tehnologie VMS care este utilizată pentru a efectua operațiuni I/O. O solicitare de blocare poate fi executată fie complet sincron, caz în care procesul așteaptă până când blocarea este acordată, fie asincron, caz în care mecanismul de captare a sistemului asincron (AST) este declanșat la obținerea blocării.

În plus, puteți seta un AST de blocare (Blocking AST), care este declanșat atunci când un proces a obținut o blocare, împiedicând un alt proces să acceseze resursa (în jargonul dezvoltatorilor VMS, denumit DoorBell AST ). Procesul inițial poate apoi, dacă este necesar, să ia măsuri pentru a permite accesul altora (de exemplu, prin coborârea sau eliberarea blocării). Blocarea AST oferă dezvoltatorilor de aplicații o modalitate convenabilă de a coordona instanțe de aplicație în cazurile în care o singură instanță este permisă să fie activă, în timp ce celelalte sunt puse în așteptare. Un exemplu de utilizare într-un cluster VMS este Cluster Node Alias, o adresă DECNet/LAT/IP care migrează în funcție de gradul de încărcare ( Load Balancing ) al nodului sau de disponibilitatea acestuia ( Failover ).

Blocare bloc de valori

Fiecare resursă are asociat un bloc de valori de blocare de 32 de octeți. Poate fi citit la achiziționarea oricărui tip de blocare (cu excepția unei blocări NULL ) și poate fi actualizat printr-un proces care a dobândit o blocare a resurselor la nivel PW sau EX .

Poate fi folosit pentru a stoca informații despre resursa aleasă de dezvoltatorul aplicației. Exemplu de utilizare: stocarea numărului de versiune al unei resurse. De fiecare dată când obiectul asociat cu acesta (de exemplu, o intrare în baza de date) este actualizat, proprietarul lacătului incrementează blocul cu valoarea lacătului. Când un alt proces dorește să citească resursa, acesta dobândește blocarea corespunzătoare și compară valoarea curentă a blocării cu valoarea pe care a avut-o ultima dată când procesul a accesat resursa blocată. Dacă valoarea este aceeași, procesul știe că resursa asociată nu a fost actualizată de la ultima dată când a fost citită și, prin urmare, nu este nevoie să o citiți din nou. Prin urmare, această tehnică poate fi folosită pentru a implementa diferite tipuri de cache într-o bază de date sau aplicații similare.

Un alt exemplu de utilizare: comunicarea între procese ( IPC - InterProcess Communication ) - în cazurile în care este necesară o reactivitate ridicată pentru schimbul de porțiuni mici de date (în limita a 32 de octeți) între procese pe diferite noduri VMS Cluster cu cerințe de latență scăzute. Pentru schimbul de porțiuni mai mari de date (până la 1 Mb) - se folosește tehnologia ICC ( serviciul de comunicare IntraCluster , SYS$ICC [2] ).

Definirea situațiilor de blocaj

Blocare reciprocă ( deadlock ) - o situație în care mai multe procese sunt într-o stare de așteptare nesfârșită pentru resursele ocupate de aceste procese în sine. E. Dijkstra a numit inițial această situație o „îmbrățișare a morții” [3] .

OpenVMS DLM verifică periodic procesele pentru situații de blocaj. În cazul în care un proces blochează resursa 1 în timp ce așteaptă ca resursa 2 să devină liberă, care este blocată de un al doilea proces care, la rândul său, așteaptă ca resursa 1 să devină liberă, al doilea proces determină o stare de blocaj. În acest caz, se fac pași pentru a ieși din starea de blocaj prin eliberarea blocării resursei care a fost blocată prima.

Clustering în Linux

În ianuarie 2006, codul OCFS2 (Oracle Cluster File System) [4] propus de programatorii corporației cu același nume a fost inclus în versiunea 2.6.16 a nucleului Linux , în noiembrie 2006 codul [5] pentru suportul software de cluster de la corporația a fost adăugată la versiunea de kernel 2.6.19 Red Hat , în special, suport pentru sistemul de fișiere GFS2 . Ambele sisteme se bazează pe modelul de succes VMS DLM [6] . În același timp, managerul de blocare distribuit de la Oracle avea un API simplificat - funcția sa de bază dlmlock()avea doar 8 parametri, în timp ce un apel de sistem similar SYS$ENQîn VMS, precum și o funcție dlm_lockîn DLM de la Red Hat, aveau 11 parametri fiecare.

Chubby, serviciul de blocare al Google

Google și-a dezvoltat implementarea unui serviciu de blocare pentru sistemele distribuite slab cuplate, pe care l-au numit Chubby [7] . Acest serviciu este conceput pentru a oferi blocare grosieră (Coarse Grained Lock), precum și pentru a sprijini un sistem de fișiere distribuit limitat funcțional, dar fiabil. Părțile majore ale infrastructurii Google, inclusiv sistemul de fișiere Google , BigTable și MapReduce , folosesc Chubby pentru a sincroniza accesul la resursele partajate. Deși Chubby a fost conceput inițial ca un serviciu de blocare, acum este utilizat pe scară largă de Google ca server de nume , înlocuind DNS [7] .

Zookeeper

Apache Zookeeper , un proiect al Apache Software Foundation , este un depozit de chei și valori ierarhice distribuite care este utilizat pentru a furniza un serviciu de configurare distribuit, un serviciu de sincronizare și un registru de nume pentru sistemele mari distribuite [8] . ZooKeeper poate fi folosit și ca manager de încuietori distribuite [9] . Zookeeper a fost inițial un sub-proiect în cadrul Hadoop , dar acum face parte din lista principală a proiectelor ASF .

Arhitectura Zookeeper acceptă disponibilitate ridicată prin redundanța serviciului. Astfel, clienții pot iniția alegerea unui alt lider Zookeeper dacă cel actual nu răspunde. Nodurile Zookeeper își stochează datele într-un spațiu de nume ierarhic similar cu un sistem de fișiere sau cu o structură de date arborescentă [10] .

Zookeeper este folosit de multe companii, inclusiv Rackspace , Yahoo! [11] , Odnoklassniki , Reddit [12] , Yandex [13] și eBay , precum și platforma de căutare open source full-text Solr [14] .

ETCD

Demonul etcd , care vă permite să actualizați setările nodurilor din infrastructura de cluster CoreOS , oferă și capabilitățile unui manager de blocare distribuit [15] .

Algoritmul Redlock în Redis

SGBD -ul de înaltă performanță non -relațional Redis , care este un depozit de date cheie-valoare jurnalizat , bazat pe rețea , poate fi utilizat pentru a implementa algoritmul de gestionare a blocării distribuite Redlock [16] .

Note

↑ Lawrence Kenah, Ruth Goldenberg. VAX/VMS Interne și structuri de date: Versiunea 5.2 . - Bedford, MA: Digital Press, 1987-12-21. — 1427 p. — ISBN 9781555580599 .
↑ Compania Hewlett-Packard Palo Alto, California. HPOpenVMSSystemServicesReferenceManual.
↑ Gehani, Narain. Ada: programare concomitentă . — Silicon Press, 1991-01-01. — ISBN 9780929306087 .
↑ kernel/git/torvalds/ linux.git - arborele sursă kernel-ului Linux . git.kernel.org. Data accesului: 14 februarie 2017.
↑ kernel/git/torvalds/ linux.git - arborele sursă kernel-ului Linux . git.kernel.org. Data accesului: 14 februarie 2017.
↑ Sistemul de fișiere OCFS2 [LWN.net ] . lwn.net. Data accesului: 14 februarie 2017. Arhivat din original pe 24 octombrie 2016. (nedefinit)
↑ 1 2 Publicație Google Research: Chubby Distributed Lock Service . research.google.com. Data accesului: 14 februarie 2017. Arhivat din original pe 20 noiembrie 2016. (nedefinit)
↑ Index - Apache ZooKeeper - Apache Software Foundation . cwiki.apache.org. Preluat la 14 februarie 2017. Arhivat din original la 25 august 2018. (nedefinit)
↑ Rețete și soluții ZooKeeper (link în jos) . zookeeper.apache.org. Consultat la 14 februarie 2017. Arhivat din original pe 16 februarie 2017. (nedefinit)
↑ ProjectDescription - Apache ZooKeeper - Apache Software Foundation . cwiki.apache.org. Consultat la 14 februarie 2017. Arhivat din original la 10 aprilie 2014. (nedefinit)
↑ ZooKeeper/PoweredBy - Hadoop Wiki (link în jos) . wiki.apache.org. Data accesului: 14 februarie 2017. Arhivat din original pe 9 decembrie 2013. (nedefinit)
↑ De ce Reddit a fost în jos pe 11 august • /r/announcements . reddit. Consultat la 14 februarie 2017. Arhivat din original pe 16 februarie 2017. (Rusă)
↑ ZooKeeper ca sistem de livrare garantată pentru Yandex.Mail . habr. Preluat la 28 iunie 2019. Arhivat din original la 27 iunie 2019. (nedefinit)
↑ SolrCloud - Ghid de referință Apache Solr - Apache Software Foundation . cwiki.apache.org. Consultat la 14 februarie 2017. Arhivat din original la 13 aprilie 2014. (nedefinit)
↑ etcd/ demo.md la master coreos/etcd GitHub . github.com. Data accesului: 14 februarie 2017.
↑ Încuietori distribuite cu Redis - Redis . redis.io. Consultat la 14 februarie 2017. Arhivat din original pe 16 februarie 2017. (nedefinit)