Grid computing ( eng. grid - lattice, network) este o formă de calcul distribuit , în care un „ supercomputer virtual ” este reprezentat ca clustere conectate printr-o rețea, computere eterogene slab conectate care lucrează împreună pentru a îndeplini un număr mare de sarcini (operații, lucrări) . Această tehnologie este folosită pentru a rezolva probleme științifice, matematice care necesită resurse de calcul semnificative. Grid computing este, de asemenea, utilizat în infrastructura comercială pentru a rezolva sarcini care necesită forță de muncă precum prognoza economică, analiza seismică și dezvoltarea și studiul proprietăților noilor medicamente.
Din punctul de vedere al organizării rețelei, grila este un mediu consistent, deschis și standardizat care oferă o separare flexibilă, sigură, coordonată a resurselor de calcul și stocare [1] a informațiilor care fac parte din acest mediu în cadrul unei organizații virtuale. [2]
Grid este o infrastructură distribuită geografic care combină multe resurse de diferite tipuri (procesoare, pe termen lung și RAM, stocare și baze de date, rețele), pe care utilizatorul le poate accesa de oriunde, indiferent de locația lor. [3]
Ideea grid computing a apărut odată cu răspândirea computerelor personale, dezvoltarea internetului și a tehnologiilor de transmisie de date sub formă de pachete bazate pe fibră optică ( SONET , SDH și ATM ), precum și a tehnologiilor de rețele locale ( Gigabit Ethernet ). Lățimea de bandă a mijloacelor de comunicare a devenit suficientă pentru a atrage resursele altui computer dacă este necesar. Având în vedere că multe computere conectate la rețeaua globală sunt inactive în cea mai mare parte a timpului de lucru și au mai multe resurse decât au nevoie pentru a-și rezolva sarcinile zilnice, devine posibil să-și aplice resursele neutilizate în altă parte.
Calculul distribuit sau grid, în general, este un tip de calcul paralel care se bazează pe computere obișnuite (cu procesoare standard, dispozitive de stocare, surse de alimentare etc.) conectate la o rețea (locală sau globală) folosind protocoale convenționale, de exemplu, Ethernet , în timp ce un supercomputer convențional conține multe procesoare conectate la o magistrală locală de mare viteză.
Principalul avantaj al calculului distribuit este că o singură celulă a sistemului de calcul poate fi achiziționată ca un computer obișnuit nespecializat. Astfel, este posibil să se obțină practic aceeași putere de calcul ca la supercalculatoarele convenționale, dar la un cost mult mai mic.
În prezent, există trei tipuri principale de sisteme de rețea:
Termenul „grid computing” a apărut la începutul anilor 1990 ca o metaforă care demonstrează posibilitatea unui acces simplu la resursele de calcul, precum și la rețeaua electrică (în engleză rețea electrică ) în colecția editată de Ian Foster și Carl Kesselman „The Grid: Blueprint”. pentru o nouă infrastructură de calcul”.
Utilizarea procesoarelor de timp liber și a calculatoarelor voluntare a devenit populară la sfârșitul anilor 1990 odată cu lansarea proiectelor de calcul voluntar GIMPS în 1996 , distributed.net în 1997 și SETI@home în 1999 . Aceste proiecte de calcul voluntare timpurii au valorificat puterea computerelor din rețea ale utilizatorilor obișnuiți pentru a rezolva sarcini de cercetare solicitante din punct de vedere computațional.
Ideile de sisteme de grilă (inclusiv idei din domeniile de calcul distribuit , programare orientată pe obiecte , clustering de computere , servicii web etc.) au fost colectate și combinate de Ian Foster, Carl Kesselmanși Steve Tuecke, care sunt adesea numiți părinții tehnologiei grid. [1] Au început să construiască setul de instrumente Globus pentru Grid Computing, care include nu numai instrumente de management de calcul, ci și instrumente pentru gestionarea resurselor de stocare a datelor, asigurarea securității accesului la date și la rețea în sine, monitorizarea utilizării și mișcării datelor, precum și instrumente pentru dezvoltarea serviciilor suplimentare de rețea. În prezent, acest set de instrumente este standardul de facto pentru construirea infrastructurii bazate pe rețea, deși există multe alte instrumente pentru sisteme de rețea pe piață, atât la nivel de întreprindere, cât și la nivel global.
Tehnologia grilă este utilizată pentru modelare și prelucrare a datelor în experimentele de la Large Hadron Collider (grila este folosită și în alte sarcini de calcul intensive). Peste 60 de proiecte sunt active în prezent pe platforma BOINC . De exemplu, proiectul Fusion (sud Franța, dezvoltarea unei metode de generare a energiei electrice prin fuziune termonucleară la reactorul experimental ITER ) folosește și o rețea ( EDGeS@Home ). Sub denumirea CLOUD a fost lansat un proiect de comercializare a tehnologiilor grid, în cadrul căruia companiile mici, instituții care au nevoie de resurse de calcul, dar nu își permit să aibă propriul centru de supercomputing dintr-un motiv sau altul, își pot cumpăra timp de calcul grid. [patru]
Sistemul Grid CERN , conceput pentru a procesa date de la Large Hadron Collider , are o structură ierarhică. [patru]
Cel mai înalt punct al ierarhiei, nivelul zero - CERN (obținerea informațiilor de la detectoare, colectarea datelor științifice „brute” care vor fi stocate până la finalul experimentului). În primul an de funcționare, este planificat să colectați până la 15 petabytes (mii terabytes) de date din prima copie.
Primul nivel, Tier1, este stocarea unei a doua copii a acestor date în alte părți ale lumii (12 centre: în Rusia, Italia , Spania, Franța , Scandinavia, Marea Britanie , SUA , Taiwan și un centru de prim nivel - CMS Tier1 - la CERN). Pe 26 martie 2015 a fost deschis un nou centru la Laboratorul de Tehnologii Informaționale din Dubna (JINR) [5] . Centrele au resurse semnificative de stocare a datelor.
Tier2 - următorul în ierarhie, numeroase centre de al doilea nivel. Nu sunt necesare resurse mari de stocare; au resurse de calcul bune. Centre rusești: în Dubna ( JINR ), trei centre la Moscova ( SINP MGU , FIAN , ITEP ), Troitsk ( INR ), Protvino ( IHEP ), Sankt Petersburg ( SPbGU ) [6] și Gatchina ( PNPI ). În plus, centrele altor state membre JINR din Harkov , Minsk , Erevan , Sofia , Baku și Tbilisi sunt, de asemenea, conectate la aceste centre într-o singură rețea .
Peste 85% din toate sarcinile de calcul de la Large Hadron Collider din 2010 au fost efectuate în afara CERN, dintre care peste 50% au fost efectuate în centre de nivel al doilea. [patru]