Memoria tranzacțională software

În tehnologia computerelor , memoria tranzacțională software ( STM ) este un mecanism de control al concurenței similar cu mecanismul tranzacției bazei de date pentru controlul accesului la memoria partajată în calculul paralel . Este o alternativă pentru sincronizarea bazată pe blocare . O tranzacție în acest context este o bucată de cod care citește și scrie în memoria partajată (partajată). Citirea și scrierea apar în mod logic la un singur moment în timp, iar stările intermediare sunt invizibile pentru alte tranzacții (rezultate). Ideea de a oferi tranzacții cu suport hardware a luat naștere în 1986 în lucrarea și brevetul lui Tom Knight . [1] Ideea a fost mediatizată de Maurice Herlihy și Eliot Moss . [2] În 1995, Nir Shavit și Dan Toytu au extins această idee la memoria tranzacțională software (STM). STM este încă în centrul cercetării intense; sprijinul său pentru implementări practice este în creștere.

Caracteristici

Spre deosebire de metodele de blocare utilizate în majoritatea aplicațiilor moderne cu mai multe fire, STM este foarte optimist: un fir de execuție completează modificările aduse memoriei partajate fără a ține cont de ceea ce fac alte fire și înregistrează orice citire și scriere în jurnal. În loc să se folosească scriitorul pentru a verifica dacă are un efect negativ asupra altor operațiuni în desfășurare, responsabilitatea este transferată către cititor, care, după finalizarea unei tranzacții complete, verifică dacă alte fire de execuție au făcut modificări concomitente în memoria care a fost accesată în trecut.. Această ultimă operație, care verifică modificările tranzacției și care, dacă verificarea reușește, rămâne neschimbată, se numește commit. Tranzacția poate fi oprită în orice moment, drept urmare toate modificările recente vor fi anulate. Dacă o tranzacție nu poate fi efectuată din cauza unor conflicte de modificare, aceasta este anulată și reîncercată de la început până când se finalizează cu succes.

Avantajul acestei abordări optimiste este sporit de paralelism: niciun fir nu trebuie să aștepte accesul la o resursă, iar firele diferite pot modifica simultan și în siguranță părți disjunctive ale structurii de date care ar fi protejate de aceeași blocare.

Cu toate acestea, în practică, sistemele STM pierd în performanță în fața sistemelor cu granulație fină bazate pe blocări pe un număr mic de procesoare (de la 1 la 4 în funcție de aplicație). Acest lucru se datorează în primul rând costurilor generale de menținere a jurnalului și timpului petrecut cu tranzacții. Dar chiar și în acest caz, performanța diferă de cel mult de 2 ori. [3] Susținătorii STM consideră că astfel de pierderi sunt justificate de avantajele conceptuale ale STM.

Teoretic, complexitatea de timp și spațiu a rulării n tranzacții paralele este O (n) în cel mai rău caz . Costul real depinde de implementare (puteți anula tranzacția mai devreme pentru a evita cheltuielile generale), dar vor exista întotdeauna cazuri, deși rare, în care algoritmii de blocare vor avea o complexitate de timp mai bună decât memoria tranzacțională software.

Avantaje și dezavantaje conceptuale

Pe lângă beneficiile de performanță, STM simplifică foarte mult înțelegerea conceptuală a programelor multithreaded și ajută la menținerea acestora, lucrând fără probleme cu abstracțiile existente la nivel înalt, cum ar fi obiectele și modulele.

Programarea blocării conține o serie de probleme cunoscute care apar adesea în practică:

Este important să fiți conștienți de operațiuni care se suprapun și operațiunile parțiale în părți separate și aparent neînrudite ale codului - o sarcină foarte dificilă și predispusă la erori.
Este necesar ca programatorii să învețe o politică de blocare pentru a evita blocajele ( Deadlocks , Livelocks ) și alte probleme de control al procesului. Astfel de politici sunt adesea aplicate în mod arbitrar și sunt eronate, iar atunci când apar probleme, ele sunt dificil de reprodus și de depanat.
Acest lucru poate duce la inversarea priorității , un fenomen în care un fir cu prioritate mare este forțat să aștepte un fir cu prioritate scăzută care are acces exclusiv la o resursă necesară.

Dimpotrivă, conceptul de memorie tranzacțională este mult mai simplu, deoarece fiecare tranzacție poate fi considerată individual, ca un calcul cu un singur thread. Blocajele sunt fie prevenite în întregime, fie rezolvate de un manager de tranzacții extern; programatorul nu trebuie să-și facă griji pentru asta. Inversarea priorității poate fi în continuare o problemă, dar tranzacțiile cu prioritate ridicată pot anula tranzacțiile conflictuale cu prioritate scăzută care nu au fost încă comise.

Pe de altă parte, necesitatea de a anula tranzacțiile eșuate impune și restricții asupra comportamentului lor: nu pot efectua nicio operațiune care nu poate fi anulată, inclusiv majoritatea I/O. Astfel de limitări sunt de obicei depășite în practică prin crearea de buffer-uri care pun în coadă operațiunile ireversibile și le execută ceva timp mai târziu în afara oricărei tranzacții. În Haskell, această restricție este impusă de sistemul de tip în timpul compilării.

Operații compuse

În 2005, Tim Harris, Simon Marlow, Simon Peyton-Jones și Maurice Herlihy au descris un sistem STM construit în Haskell care implementează paralelismul. Acest sistem permite combinarea operațiunilor atomice arbitrare în operațiuni atomice mai mari, un concept util care nu este posibil cu programarea blocării. Potrivit autorilor:

„Poate cel mai fundamental dezavantaj este că programele de blocare nu pot lega: fragmentele corecte pot să nu funcționeze atunci când sunt legate. Luați în considerare, de exemplu, un tabel hash cu inserări și ștergeri sigure pentru fire. Acum să presupunem că vrem să eliminăm un element din tabelul t1 și să-l inserăm în tabelul t2, dar starea intermediară (în care niciun tabel nu conține acel element) nu ar trebui să fie vizibilă pentru alte fire. Până când proiectantul tabelului hash nu determină această nevoie, pur și simplu nu există nicio modalitate de a satisface această cerință. În general, fiecare operație corectă (inserții, ștergeri) nu poate fi combinată în operații corecte mai mari.

— (Tim Harris și colab., „Operațiunea de acces la memorie compusă”, Secțiunea 2. Context, p.2)

Cu STM, această problemă se rezolvă simplu: simpla combinare a două operații într-o singură tranzacție transformă o operație componabilă într-una atomică. Singura piatră de poticnire este că nu este clar pentru apelant, care nu cunoaște detaliile de implementare a metodelor de legătură, când ar trebui să încerce să reîncerce tranzacția dacă aceasta nu are loc. Ca răspuns la aceasta, autorii au propus o comandă de reîncercare care utilizează jurnalul de tranzacții (fișierul jurnal) generat de tranzacția eșuată pentru a determina fragmentul de memorie pe care o citește. Apoi începe automat tranzacția din nou când una dintre aceste locații de memorie se schimbă. Aceasta se bazează pe logica că o tranzacție nu se va comporta diferit până când cel puțin o astfel de valoare nu se va schimba.

Autorii au propus, de asemenea, un mecanism de construire a alternativelor (funcția orElse). Începe o tranzacție și dacă tranzacția reîncearcă, începe o a doua. Dacă la fel se întâmplă și cu al doilea, mecanismul le pornește din nou pe amândouă până când apare o schimbare semnificativă. Această funcție, comparabilă cu funcția standard select() de rețea POSIX, permite apelantului să aștepte oricare dintre mai multe evenimente în același timp. De asemenea, simplifică programarea interfeței, de exemplu prin furnizarea unui mecanism simplu de conversie între operațiunile de blocare și neblocare.

Această schemă a fost implementată în compilatorul Haskell GHC .

Limba auxiliară sugerată

Simplitatea conceptuală a sistemelor STM permite programatorului să lucreze cu ușurință cu ele folosind o sintaxă relativ simplă a limbajului. În cartea lor An Auxiliary Language for Lightweight Transactions, Tim Harris și Keir Fraser au propus ideea de a utiliza Regiunea Critică Condițională (CCR) clasică pentru a reprezenta tranzacțiile. În forma sa cea mai simplă, acesta este doar un „bloc atomic”, o bucată de cod care este executată secvenţial la un singur moment în timp:

// Inserați atomic un nod într-o listă dublu legată atomic { newNode->prev = nod; newNode->next = nod->next; nod->next->prev = newNode; nod->next = newNode; }

Când se ajunge la sfârșitul blocului, tranzacția este comisă, dacă este posibil, în caz contrar se încheie și se repetă. Regiunile critice condiționate permit, de asemenea, o condiție de persistență, care permite unei tranzacții să aștepte până când munca sa este în vigoare.

atomic (queueSize > 0) { eliminați elementul din coadă și utilizați-l }

Dacă condiția eșuează, managerul de tranzacții va aștepta până când apare o alta care va afecta condiția înainte de a încerca din nou. Această comunicare liberă între producători și consumatori îmbunătățește modularitatea față de semnalizarea clară între fire. Composable Memory Access merge mai departe cu comanda sa de reîncercare (vezi mai sus), care poate anula tranzacția în orice moment și poate aștepta până când există o modificare a valorii citite anterior de operație înainte de a reîncerca. Exemplu:

atomic { if (QueueSize > 0) { eliminați elementul din coadă și utilizați-l } altfel { reîncercați } }

Această capacitate de a reîncerca în mod dinamic la sfârșitul unei tranzacții simplifică modelul de programare și deschide noi posibilități.

O problemă este comportamentul excepțiilor atunci când se propagă în afara tranzacțiilor. În „A Composable Memory Access Operation”, autorii au decis că aceasta ar trebui să anuleze tranzacția, deoarece excepțiile indică, de obicei, erori neașteptate în Haskell (cu concurență), dar că această excepție poate stoca informațiile furnizate și le poate citi în timpul tranzacției în acest scop. de diagnosticare. Ei subliniază că alte decizii de proiectare sunt, de asemenea, rezonabile în raport cu alți parametri.

Blocare tranzacțională

STM poate fi implementat ca un algoritm fără blocare și blocabil. Există două tipuri de blocare.

Operațiunea de blocare a coliziunilor (Enals, Saha și Harris), în care scrierile în memorie sunt efectuate prin blocarea temporară a zonei de memorie dată, scrierea directă a valorilor și înregistrarea lor în jurnalul de rulare a operațiunii.
Blocarea tranzacției, care blochează numai celulele de memorie în timp ce faza este în desfășurare.

Schema de execuție a tranzacțiilor, numită „Transactional Locking-2” și implementată de Dice, Shalev și Shavit, folosește ora globală. Fiecare tranzacție începe prin citirea valorii curente a timpului și o stochează pentru citire. Apoi, la fiecare citire și scriere, versiunea zonei de memorie specificată este comparată cu versiunea pentru citire, iar dacă este mai mare, tranzacția este anulată. Acest lucru asigură că codul se execută pe copia corespunzătoare a memoriei. În timpul comiterii, toate regiunile de citire sunt blocate, iar valorile versiunii date a tuturor regiunilor de memorie de scriere și citire sunt verificate din nou. În cele din urmă, ora globală este incrementată, noile valori ale intrării de jurnal sunt scrise înapoi în memorie cu noua versiune a timpului.

O metodă din ce în ce mai populară pentru gestionarea conflictelor tranzacționale în memoria tranzacțională , în special în STM-uri, este ordinea în care(CO). Este utilizat pentru a obține o comandă fără blocare (adică fără blocare pentru tranzacțiile conflictuale și blocarea doar pentru comiterea tranzacțiilor) prin reordonarea tranzacțiilor (de exemplu, Ramadan și colab. 2009 și Zhang și colab. 2006). Comandarea este baza pentru starea corectă a memoriei tranzacționale (când se efectuează tranzacții paralele). Zeci de lucrări și brevete au fost deja publicate despre STM folosind „ordinul de executare”.

„Zhang şi colab., 2006” este un brevet american intitulat „Software de comandă de tranzacţii şi managementul conflictelor” (care se referă la brevetul US 5.701.480 de ordine de comandă). Iată fragmente:

„Sunt dezvoltate diverse tehnologii și metode pentru a aplica ordinea de execuție într-un sistem de memorie tranzacțională software. Sistemul de memorie tranzacțională a programului este echipat cu o funcție, astfel încât să se aplice o ordine predefinită de execuție multe operatii. Ordinea de comitere predefinită este utilizată în timpul execuției pentru a stabili ordinea în care efectuați tranzacții în sistemul de memorie tranzacțională software. Procesul de management al conflictului este invocat atunci când conflict între prima și a doua tranzacție. Ordinea predefinită de comitere este utilizată în procesul de gestionare a conflictului, pentru a determina ce tranzacție ar trebui să câștige conflictul și să i se permită să continue”.

Cu ordinea de comitere, proprietatea dorită de ordonare este realizată prin efectuarea tranzacțiilor numai în ordine cronologică compatibilă cu ordinea de prioritate (după cum este determinată de ordinea cronologică a operațiunilor în conflicte)

Implementări

SRTM a fost implementat (de diferite calități și stabilitate) în diferite limbaje de programare. Ca:

C/C++

TBoost.STM (fost DracoSTM) Un efort de colaborare între CU-Boulder și Boost Libraries Group a creat o bibliotecă pentru C++ STM, în primul rând de Justin E. Gottschlich și Jeremy G. Siek.
TinySTM STM bazat pe timp și Tanger pentru integrarea STM cu C și C++ prin LLVM.
Biblioteca de tranzacții ușoare (LibLTX), implementare pentru C, (de Robert Ennals), accentul principal este pe eficiență. Implementarea se bazează pe articolele sale „Software Transactional Memory Should Not Be Obstruction-Free” și „Cache Sensitive Software Transactional Memory”.
LibCMT , o implementare C open source de Duilio Protti bazată pe „Tranzacții cu memorie compusă”. Această implementare include și legarea C# .
TARIFA este un prototip care implementează cuvântul cheie „atomic” în C/C++.
Implementarea Intel STM Compiler Prototype Edition a STM pentru C/C++ direct în compilator (Intel Compiler) pentru Linux sau Windows, generând cod pe 32 sau 64 de biți pentru procesoarele Intel și AMD. Implementează cuvântul cheie „atomic” și oferă, de asemenea, modalități de decorare a definițiilor funcțiilor (declspec) pentru a controla/permite utilizarea în secțiunile „atomice”.
stmmap este o implementare STM în C bazată pe memorie partajată. Proiectat pentru a partaja memorie între fire și/sau procese (nu doar între firele dintr-un proces) cu semantică tranzacțională. C++ implementează o versiune multi-threaded a acestui alocator .
Implementarea CTL a STM în C, bazată pe TL2 dar cu multe extensii și optimizări.
Mai multe implementări realizate de Tim Harris și Keir Fraser , bazate pe o idee din Language Support for Lightweight Transactions, Practical Lock Freedom și lucrări nepublicate viitoare.
RSTM University of Rochester STM scris de o echipă de oameni de știință condusă de Michael L. Scott .
G++ 4.7 acceptă deja STM pentru C/C++ chiar în compilator. Această caracteristică este încă experimentală, dar oferă funcționalitatea necesară pentru testare.

C#

Implementare SXM pentru C# Microsoft Research . Documentație , Pagina de descărcare (link indisponibil) .
LibCMT , o implementare open source (Duilio Protti) bazată pe „Tranzacții cu memorie compusă”. Implementarea include, de asemenea, legarea C# .
NSTM , o memorie tranzacțională software .NET scrisă în întregime în C#, oferă tranzacții imbricate și chiar integrare cu System.Transactions.
MikroKosmos Un model de implementare orientat spre verificare a unui STM în C#.

Clojure

Suportul Clojure STM este încorporat în nucleul limbajului.

Common Lisp

CL-STM este o implementare STM multiplatformă pentru Common Lisp.

Haskell

Biblioteca STM , așa cum se menționează în Composable Memory Transactions , face parte din Platforma Haskell .

Java

Implementarea grupului de cercetare SCAT a AtomJava.
JVSTM implementează conceptul de cutii cu versiuni propus de João Cachopo și António Rito Silva, membri ai Software Engineering Group - INESC-ID
XSTM este open source pentru Java și .NET cu o arhitectură extensibilă. XSTM este implementat ca o bibliotecă și oferă, de asemenea, extensii pentru notificarea modificărilor, persistența și replicarea obiectelor.
Mediu de dezvoltare Deuce pentru memoria tranzacțională software Java folosind bytecode.
Multiverse Java 1.6+ bazat pe Software Transactional Memory (STM). Această implementare folosește Multi Version Concurrency Control (MVCC) ca mecanism de control paralel.
Biblioteca Dynamic STM a DSTM2 Sun Lab.
Distribuție ObjectFabric STM.

OCaml

coThreads și, în același timp, biblioteca de programare OCaml , oferă STM (inițial STMLib ) ca modul. Ca orice altă componentă din această bibliotecă, modulul STM poate fi utilizat împreună cu firele de execuție la nivel de VM, un sistem de fire și procese.

Perl

STM pentru Perl 6 a fost implementat în Pugs prin biblioteca STM a Glasgow Haskell Compiler .

Python

Durus este o implementare STM simplă, dar completă și rapidă pentru Python , care permite STM să fie utilizat într-un singur proces și STM într-o arhitectură server/client multiplu. În plus față de formatul de memorie încorporată, există și altele, cum ar fi Berkeley DB , disponibile aici .
Furcătură de CPython cu blocări atomice Arhivat 25 martie 2012 la Wayback Machine - Armin Rigo explică corecția sa CPython într- un e-mail către lista pypy-dev .
pypy-stm Arhivat 5 decembrie 2013 la Wayback Machine , un add-on PyPy cu o implementare funcțională a interpretului Python 2.7 care acceptă execuția simultană a firelor de execuție ale aplicațiilor cu mai multe fire existente pe diferite nuclee CPU.

scala

ScalaSTM Biblioteca ușoară STM pentru Scala.
RadonSTM STM pentru Scala, care a fost implementat ca parte a proiectului Activate Framework

Smalltalk

GemStone/S [1] Server de obiecte de memorie tranzacțională pentru Smalltalk.

Alte limbi

Limbajul Fortress dezvoltat de Sun, folosește DSTM2
STM.NET

Note

↑ Tom Knight. O arhitectură pentru limbaje preponderent funcționale. Arhivat la 1 noiembrie 2013 la Wayback Machine Proceedings al conferinței ACM din 1986 despre LISP și programarea funcțională.
↑ Maurice Herlihy și J. Eliot B. Moss. Memoria tranzacțională: suport arhitectural pentru structuri de date fără blocare. Proceedings of the 20th annual international simpozion on Computer Architecture (ISCA '93). Volumul 21, numărul 2, mai 1993.
↑ Simon Peyton-Jones. Programarea în era concurenței: memorie tranzacțională software . Channel 9. Preluat la 9 iunie 2007. Arhivat din original la 2 septembrie 2012. (nedefinit)

Link -uri

Morry Katz, PARATRAN: Un mecanism transparent de rulare bazat pe tranzacții pentru execuția paralelă a Scheme , MIT LCS, 1989
Nir Shavit și Dan Touitou. Memorie tranzacțională software . Proceedings of the 14th ACM Symposium on Principles of Distributed Computing , pp. 204–213. august 1995. Lucrarea originară STM.
Maurice Herlihy, Victor Luchangco, Mark Moir și William N. Scherer III. Memorie tranzacțională software pentru structuri de date de dimensiuni dinamice . Proceedings of the Twenty-Second Annual ACM SIGACT-SIGOPS Symposium on Principles of Distributed Computing (PODC) , 92-101. iunie 2003
Tim Harris și Keir Fraser. Suport lingvistic pentru tranzacții ușoare . Programare orientată pe obiecte, sisteme, limbaje și aplicații , pp. 388–402. octombrie 2003.
Tim Harris, Simon Marlow, Simon Peyton Jones și Maurice Herlihy. Tranzacții cu memorie composabilă . Simpozionul ACM privind principiile și practica programării paralele 2005 (PPoPP'05). 2005.
Robert Anales. Memoria tranzacțională software nu ar trebui să fie fără obstacole .
Michael L. Scott și colab. Reducerea suprasarcinii memoriei tranzacționale software neblocante oferă o introducere bună nu numai la RSTM, ci și la abordările STM existente.
Torvald Riegel și Pascal Felber și Christof Fetzer, A Lazy Snapshot Algorithm with Eager Validation introduce primul STM bazat pe timp.
Dave Dice, Ori Shalev și Nir Shavit. Blocarea tranzacțională II .
Knight, TF, O arhitectură pentru limbaje mai ales funcționale , ACM Lisp și Conferința de programare funcțională, august 1986.
Knight, TF, Sistem și metodă de procesare paralelă cu limbaje mai ales funcționale, brevetul SUA 4.825.360, aprilie 1989.
Ali-Reza Adl-Tabatabai, Christos Kozyrakis, Bratin Saha, Unlocking concurrency , ACM Queue 4, 10 (decembrie 2006), pp. 24–33. Leagă procesoarele multicore și cercetarea/interesul pentru STM.
James R Larus, Ravi Rajwar, Memoria tranzacțională , Editura Morgan și Claypool, 2006.
Leonid Chernyak. Memoria tranzacțională - primii pași // Open Systems, Nr. 04, 2007