Rosetta@home | |
---|---|
| |
Tip de | Protein Structure Prediction , Volunteer Computing și Berkeley Open Infrastructure pentru proiecte de Network Computing [d] |
Dezvoltator | Laboratorul Baker , Universitatea din Washington , Rosetta Commons |
Sistem de operare | Software multiplatformă |
Prima editie | 6 octombrie 2005 |
Platformă hardware | BOINC |
ultima versiune | Rosetta Mini: 3,71 [1] ( 20 ianuarie 2016 ) |
Stat | Activ |
Licență | Gratuit pentru uz academic și non-profit, licență proprietară disponibilă pentru uz comercial [2] |
Site-ul web | boinc.bakerlab.org/roset… |
Fișiere media la Wikimedia Commons |
Rosetta@home | |
---|---|
Platformă | BOINC |
Dimensiunea de descărcare a software -ului | 48 MB |
Dimensiunea datelor încărcate de job | 2,5 MB |
Cantitatea de date despre job trimisă | 6-150 KB |
Spațiu pe disc | 130 MB |
Cantitatea de memorie folosită | 255 MB |
GUI | există |
Timp mediu de calcul al sarcinii | 0,5 - 10 ore (posibil controlul timpului) |
termen limita | 10 zile |
Abilitatea de a utiliza GPU | Nu |
Fișiere media la Wikimedia Commons |
Rosetta@Home este un proiect de calcul voluntar care își propune să rezolve una dintre cele mai mari probleme din biologia moleculară - calcularea structurii terțiare a proteinelor din secvențele lor de aminoacizi . Datorită proiectului genomului uman finalizat, sunt cunoscute secvențele de aminoacizi ale tuturor proteinelor din corpul uman. Cercetarea în cadrul acestui proiect va ajuta, de asemenea, la proiectarea de noi proteine inexistente. În timp ce o mare parte din proiect se concentrează pe cercetarea de bază pentru a îmbunătăți acuratețea și robustețea metodelor de proteomică, Rosetta@home promovează, de asemenea, cercetarea aplicată pentru combaterea bolilor precum cancerul , malaria , Alzheimer , antraxul și alte boli genetice și virale [3] . Foldit este un joc video de la Rosetta@Home care își propune să atingă obiectivele proiectului printr-o abordare crowdsourced .
Rezultatele calculelor Rosetta@Home nu sunt disponibile direct. De asemenea, nu puteți utiliza rezultatele calculelor propriului computer. [4] Cu toate acestea, ele sunt utilizate pentru un număr mare de publicații științifice. [5]
În esență, Rosetta este un program de calculator ale cărui sarcini principale sunt:
Acest proiect folosește feedback de predicție și rezultate pentru a îmbunătăți potențialele funcții și algoritmi de căutare .
Aplicația Rosetta@home și Platforma de calcul distribuită BOINC , disponibile pentru sistemele de operare Windows, Linux și macOS; BOINC rulează și pe mai multe altele, cum ar fi FreeBSD. Participarea la Rosetta@home necesită o unitate centrală de procesare (CPU) cu o viteză de ceas de cel puțin 500 MHz, 200 megaocteți de spațiu liber pe disc, 512 megaocteți de memorie fizică și o conexiune la internet. Începând cu 27 iunie 2020, versiunea actuală a aplicației Rosetta Mini este 4.20. Versiunea curentă recomandată a software-ului BOINC este 7.16.7. Protocolul standard de transfer al hipertextului (HTTP) (portul 80) este utilizat pentru comunicațiile dintre clientul BOINC al utilizatorului și serverele Rosetta@home de la Universitatea din Washington ; HTTPS (portul 443) este utilizat în timpul schimbului de parole. Gestionarea de la distanță și locală a clientului BOINC utilizează portul 31416 și portul 1043, care pot fi deblocate în mod specific dacă se află în spatele unui firewall. Unitățile de lucru care conțin date despre proteinele individuale sunt distribuite de la serverele situate în Laboratorul Baker de la Universitatea din Washington către computere voluntare, care calculează apoi o predicție de structură pentru proteina atribuită. Pentru a evita predicțiile repetitive ale structurii pentru o anumită proteină, fiecare bloc de lucru este inițializat cu un număr aleatoriu de semințe. Acest lucru oferă fiecărei predicții o traiectorie unică pentru a coborî prin peisajul energetic al proteinei. Predicțiile privind structura proteinelor de la Rosetta@home sunt valori aproximative pentru minimul global în peisajul energetic al unei anumite proteine. Acest minim global reprezintă conformația proteică cea mai favorabilă din punct de vedere energetic, adică starea sa nativă.
Caracteristica principală a interfeței grafice cu utilizatorul (GUI) Rosetta@home este un protector de ecran care afișează starea curentă a modulului de rulare în timpul simulării plierii proteinelor. Colțul din stânga sus al ecranului de splash curent arată proteina țintă asumând diferite forme (conformații) în căutarea structurii cu cea mai scăzută energie. Imediat în dreapta este structura ultimului primit. Colțul din dreapta sus arată cea mai scăzută conformație energetică a aspectului curent; mai jos este structura adevărată sau nativă a proteinei dacă aceasta a fost deja determinată. Trei diagrame sunt incluse în ecranul de introducere. Aproape de mijloc, este afișat un grafic pentru energia termodinamică liberă a modelului acceptat, care fluctuează pe măsură ce modelul acceptat se modifică. Graficul deviației standard a modelului acceptat (RMSD), care măsoară cât de asemănător structural este modelul acceptat cu modelul nativ, este prezentat în partea dreaptă. În dreapta diagramei energiei primite și sub diagrama RMSD, rezultatele acestor două funcții sunt utilizate pentru a reprezenta reprezentarea energiei față de RMSD pe măsură ce modelul este rafinat treptat.
La fel ca toate proiectele BOINC, Rosetta@home rulează în fundal pe computerul utilizatorului, folosind puterea de la computerul inactiv, în timpul sau înainte de a vă conecta la un cont pe sistemul de operare al gazdei . Programul eliberează resurse din CPU pe măsură ce alte aplicații au nevoie de ele, ceea ce nu afectează utilizarea normală a computerului. Multe opțiuni ale programului pot fi setate prin setările contului de utilizator, inclusiv: procentul maxim de resurse CPU pe care programul le poate utiliza (pentru a controla consumul de energie sau pentru a genera căldură de la un computer care rulează la putere constantă), ora din zi în care programul poate rula și mai altele.
Rosetta, software-ul care rulează pe rețeaua Rosetta@home, a fost rescris în C++ pentru a fi mai ușor de dezvoltat decât a fost permis de versiunea sa originală scrisă în Fortran. Această nouă versiune este orientată pe obiecte și a fost lansată pe 8 februarie 2008. Dezvoltarea codului Rosetta este realizată de Rosetta Commons. Software-ul este licențiat liber comunității academice și este disponibil pentru companiile farmaceutice contra cost.
Odată cu proliferarea proiectelor de secvențiere a genomului , oamenii de știință pot deduce secvența de aminoacizi sau structura primară a multor proteine care îndeplinesc funcții într-o celulă. Pentru a înțelege mai bine funcția proteinelor și pentru a ajuta la proiectarea rațională a medicamentelor, oamenii de știință trebuie să cunoască structura terțiară tridimensională a proteinei.
Structurile tridimensionale ale proteinelor sunt în prezent determinate experimental folosind cristalografie cu raze X sau spectroscopie de rezonanță magnetică nucleară (RMN). Procesul este lent (poate dura săptămâni sau chiar luni pentru a descoperi cum să cristalizezi o proteină pentru prima dată) și costisitor (aproximativ 100.000 USD per proteină). Din păcate, rata la care sunt descoperite noi secvențe o depășește cu mult pe cea de determinare a structurii - din cele peste 7.400.000 de secvențe de proteine disponibile în baza de date de proteine nereducete (nr) a Centrului Național pentru Informații Biotehnologice (NCBI), există mai puțin de 52.000 de secvențe tridimensionale. structurile proteinelor au fost rezolvate și plasate în Protein Data Bank, principalul depozit de informații structurale despre proteine [6] . Unul dintre obiectivele principale ale Rosetta@home este de a prezice structurile proteinelor cu aceeași acuratețe ca și metodele existente, dar într-un mod care necesită mult mai puțin timp și bani. Rosetta@home dezvoltă, de asemenea, metode pentru determinarea structurii și andocării proteinelor membranare (de exemplu, receptorii cuplați cu proteine G (GPCR)), care sunt extrem de dificil de analizat cu metode tradiționale, cum ar fi cristalografia cu raze X și spectroscopia RMN, dar care reprezintă majoritatea țintelor pentru medicamentele moderne.
Progresul în predicția structurii proteinelor este măsurat în experimentul bianual de evaluare critică pentru predicția structurii proteinelor (CASP), în care cercetătorii din întreaga lume încearcă să obțină structura proteinei din secvența de aminoacizi a unei proteine. Grupurile de înaltă performanță din acest experiment uneori competitiv sunt considerate standardul de facto pentru ceea ce este stadiul tehnicii în predicția structurii proteinelor. Rosetta, programul pe care se bazează Rosetta @ home, a fost folosit cu CASP5 în 2002. În experimentul CASP6 din 2004, Rosetta a făcut istorie fiind prima care a obținut o rezoluție aproape atomică ab initio predicția structurii proteinei în modelul ei prezentat pentru ținta CASP T0281. Modelarea ab initio este considerată o categorie deosebit de provocatoare de predicție a structurii proteinei, deoarece nu utilizează informații din omologia structurală și trebuie să se bazeze pe informațiile din omologia secvenței și modelarea interacțiunilor fizice din cadrul proteinei. Rosetta@home a fost folosită în CASP din 2006, unde a fost unul dintre cei mai buni predictori din fiecare categorie de predicție structurală din CASP7. Aceste predicții de înaltă calitate au fost alimentate de puterea de calcul oferită de voluntarii Rosetta@home. Creșterea puterii de calcul îi permite lui Rosetta@home să selecteze mai multe regiuni ale spațiului conformațional (forme posibile pe care le poate lua o proteină) care, conform Paradoxului lui Levinthal , se preconizează că vor crește exponențial cu lungimea proteinei.
Rosetta@home este, de asemenea, utilizat în predicția de andocare proteine-proteine, care determină structura proteinelor complexe multiple sau structura cuaternară. Acest tip de interacțiune proteică afectează multe funcții celulare, inclusiv legarea antigen-anticorp și legarea enzimă-inhibitor, precum și importul și exportul de celule. Determinarea acestor interacțiuni este esențială pentru dezvoltarea medicamentelor. Rosetta este utilizată în experimentul Critical Interaction Prediction Evaluation (CAPRI), care evaluează starea câmpului de andocare a unei proteine, similar modului în care CASP măsoară progresul în predicția structurii proteinei. Puterea de calcul furnizată de voluntarii proiectului Rosetta@home a fost citată drept unul dintre principalii factori ai performanței Rosettei la CAPRI, unde previziunile sale de andocare au fost printre cele mai precise și complete.
La începutul anului 2008, Rosetta a fost folosită pentru a proiecta computațional o proteină cu o funcție care nu a fost văzută anterior în natură. Acest lucru a fost parțial inspirat de o prescurtare a unei celebre lucrări din 2004 care a descris inițial designul computațional al unei proteine cu activitate enzimatică îmbunătățită față de forma sa naturală. O lucrare de cercetare din 2008 de la grupul lui David Baker care descrie modul în care a fost făcută proteina, în care Rosetta@home se referă la resursele de calcul pe care le-a pus la dispoziție, este o dovadă importantă a conceptului pentru această metodă de inginerie a proteinelor. Acest tip de design de proteine poate avea aplicații viitoare pentru descoperirea de medicamente, chimie ecologică și bioremediere.
O componentă a pachetului software Rosetta, RosettaDesign, a fost utilizată pentru a prezice cu exactitate care regiuni ale proteinelor amiloidogene sunt cele mai susceptibile de a forma fibrile asemănătoare amiloidului. Luând hexapeptide (șase fragmente lungi de aminoacizi) dintr-o proteină de interes și selectând cea mai mică potrivire cu energie pentru o structură similară cu cea a unei hexapeptide cunoscute care formează fibrile, RosettaDesign a reușit să identifice peptidele de două ori mai susceptibile de a forma fibrile decât proteinele aleatorii. . Rosetta@home a fost folosită în același studiu pentru a prezice structurile beta-amiloidului, o proteină care formează fibrile despre care se crede că provoacă boala Alzheimer. Au fost obținute rezultate preliminare, dar nepublicate încă, pentru proteinele dezvoltate de Rosetta care pot preveni formarea fibrilelor, deși nu se știe dacă acest lucru poate preveni boala.
O altă componentă a Rosetta, RosettaDock, a fost folosită împreună cu metode experimentale pentru a modela interacțiunile dintre trei proteine - factorul letal (LF), factorul de edem (EF) și antigenul de protecție (PA) - care alcătuiesc toxina antraxului. Modelul computerizat a prezis cu precizie andocarea dintre LF și PA, ajutând la stabilirea ce domenii ale proteinelor respective sunt implicate în complexul LF-PA. Această înțelegere a fost în cele din urmă folosită în cercetare, rezultând vaccinuri îmbunătățite cu antrax.
RosettaDock a fost folosit pentru a modela andocarea între un anticorp (imunoglobulina G) și o proteină de suprafață exprimată de virusul herpesului, virusul herpes simplex 1 (HSV-1), care servește la degradarea anticorpului antiviral. Complexul de proteine prezis de RosettaDock a fost de acord îndeaproape cu modelele experimentale deosebit de dificil de obținut, ceea ce a determinat cercetătorii să concluzioneze că metoda de andocare ar putea rezolva unele dintre problemele pe care le are cristalografia cu raze X în modelarea interfețelor proteină-proteină.
Prin cercetare finanțată printr-un grant Bill & Melinda Gates în valoare de 19,4 milioane de dolari. SUA, Rosetta@home a fost folosită în dezvoltarea multor posibile vaccinuri împotriva virusului imunodeficienței umane (HIV).
În cercetările asociate cu inițiativa Marile provocări în sănătatea globală, Rosetta a fost folosită pentru a dezvolta computațional noi proteine endonucleaze care ar putea ucide Anopheles gambiae sau ar putea face țânțarul în imposibilitatea de a transmite malaria. Capacitatea de a modela și modifica în mod specific interacțiunile proteină-ADN, cum ar fi cele ale endonucleazelor homing, conferă metodelor de inginerie computațională a proteinelor, cum ar fi Rosetta, un rol important în terapia genică (care include potențiale tratamente pentru cancer).
Pe baza statisticilor oficiale ale participanților la proiect Rosetta@Home [7] , în octombrie 2011, numărul participanților activi era de 38 mii de persoane [8] . În iulie 2017, proiectul avea aproximativ 300.000 de utilizatori activi [9] .
de calcul voluntare | Proiecte|
---|---|
Astronomie |
|
Biologie și medicină |
|
cognitive |
|
Climat |
|
Matematica |
|
Fizic și tehnic |
|
Multifunctional |
|
Alte |
|
Utilități |
|