Familia de proteine

O familie de proteine  ​​este un grup de proteine ​​înrudite evolutiv care au o secvență de aminoacizi omoloagă . Acest termen este aproape sinonim cu termenul „familie de gene”, deoarece dacă proteinele au secvențe de aminoacizi omoloage, atunci genele care le codifică trebuie să prezinte, de asemenea, un grad semnificativ de omologie în secvențele de nucleotide ADN . Acest termen nu trebuie confundat cu termenul „ familie ” din taxonomia speciilor de organisme vii .


Utilizarea terminologiei

Ca și în cazul multor alți termeni biologici, utilizarea unei familii de proteine ​​este foarte dependentă de context: se poate referi la un grup mare de proteine ​​cu omologie subtilă de secvență primară sau la un grup foarte restrâns de proteine ​​cu aproape aceeași structură, funcție și aceeași structură primară. organizare tridimensională sau orice alt caz intermediar. Pentru a face distincția între aceste două situații extreme, Dyhoff a introdus conceptul de superfamilie de proteine ​​[1] [2] [3] . De-a lungul timpului, au fost inventate concepte precum clasă , grup , clan și subfamilie , dar toate au suferit aceeași soartă ambiguă. În uzul obișnuit, se înțelege că o superfamilie (omologie structurală) conține familii (omologie de secvență primară) care conține subfamilii. Prin urmare, o superfamilie precum clanul proteazei PA are un nivel mai scăzut de secvențe conservate decât una dintre familiile sale membre, cum ar fi familia C04. Pare puțin probabil ca în viitorul apropiat să apară o definiție precisă cu criterii clare și, prin urmare, cititorul va trebui să decidă singur cum să înțeleagă exact acești termeni în fiecare context specific.

.

Domenii și motive proteice

Conceptul de familie de proteine ​​a apărut într-o perioadă în care încă existau foarte puține proteine ​​cu o structură primară și terțiară cunoscută; au fost investigate în principal proteine ​​mici, cu un singur domeniu, cum ar fi mioglobina , hemoglobina și citocromul c . De atunci, s-a descoperit că multe proteine ​​conțin multe unități sau domenii independente structural și funcțional . Datorită recombinării genelor care a avut loc în timpul evoluției, diferite domenii s-au dezvoltat independent. Din acest motiv, în ultimii ani, s-a acordat din ce în ce mai multă atenție familiilor de domenii proteice. O serie de resurse online sunt dedicate definirii și catalogării unor astfel de domenii (vezi lista de la sfârșitul articolului).

Părțile fiecărei proteine ​​au constrângeri structurale diferite (adică caracteristici structurale necesare pentru a menține structura și funcția proteinei). De exemplu, pentru funcționarea situsului activ al unei enzime , este necesar ca anumite resturi de aminoacizi să fie localizate foarte precis unele față de altele în spațiul tridimensional. Pe de altă parte, interacțiunea proteină-proteină poate avea loc pe o suprafață mare și poate fi limitată de hidrofobicitatea sau hidrofilitatea aminoacizilor. Părțile importante din punct de vedere funcțional ale proteinelor evoluează mai lent decât regiunile neconservate, cum ar fi buclele de suprafață și dau naștere la blocuri de secvențe conservate. Astfel de blocuri sunt de obicei numite motive . Ca și în cazul precedent, o serie de resurse online sunt dedicate definirii și catalogării acestora.

Evoluția familiilor de proteine

Conform ideilor actuale, familiile de proteine ​​pot fi formate în două moduri. În primul caz, specia parentală este împărțită în două specii descendente izolate genetic, ceea ce permite genei/proteinei să acumuleze în mod independent variații ( mutații ) în aceste două linii. Ca rezultat, se formează o familie de proteine ​​ortologe , având de obicei un motiv conservat comun. A doua cale este duplicarea genelor și apariția unui paralog . Deoarece prima copie a genei este încă capabilă să-și îndeplinească funcția, duplicatul este liber să se schimbe și să dobândească noi funcții (prin mutații aleatorii). Unele familii de gene/proteine, în special la eucariote , suferă o copiere sau o reducere semnificativă în timpul evoluției, uneori împreună cu dublarea întregului genom.

Importanța familiilor de proteine

Pe măsură ce numărul total de proteine ​​cu o structură cunoscută crește și interesul pentru analiza proteomică crește, se încearcă organizarea proteinelor în familii și descrierea domeniilor și motivelor acestora. Identificarea fiabilă a familiilor de proteine ​​este vitală pentru analiza filogenetică , determinarea funcției proteinelor și studiul multiplicității funcțiilor proteinelor într-un grup filogenetic dat. Inițiativa Funcție Enzimatică (EFI) folosește familiile și superfamiliile de proteine ​​ca bază pentru crearea unei strategii pentru distribuția taxonomică la scară largă a enzimelor cu funcție necunoscută [4] .

Mijloacele algoritmice pentru stabilirea unei familii de proteine ​​se bazează pe conceptul de similaritate. De cele mai multe ori, singura similitudine la care avem acces este omologia structurii primare.

Resurse pentru familiile de proteine

Există multe baze de date biologice dedicate familiilor de proteine ​​care vă permit să determinați rapid dacă o proteină nou descoperită și identificată este membru al unei familii de proteine ​​deja cunoscute. În special:

Există și motoare de căutare specializate:

Vezi și

Note

  1. Dayhoff MO Analiza computerizată a secvențelor de proteine.  (Engleză)  // Procedurile federației. - 1974. - Vol. 33, nr. 12 . - P. 2314-2316. — PMID 4435228 .
  2. Dayhoff MO , McLaughlin PJ , Barker WC , Hunt LT Evoluția secvențelor în cadrul superfamiliilor de proteine  ​​// Die Naturwissenschaften. - 1975. - Aprilie ( vol. 62 , nr. 4 ). - S. 154-161 . — ISSN 0028-1042 . - doi : 10.1007/BF00608697 .
  3. Dayhoff MO Originea și evoluția superfamiliilor de proteine.  (Engleză)  // Procedurile federației. - 1976. - Vol. 35, nr. 10 . - P. 2132-2138. — PMID 181273 .
  4. Gerlt John A. , Allen Karen N. , Almo Steven C. , Armstrong Richard N. , Babbitt Patricia C. , Cronan John E. , Dunaway-Mariano Debra , Imker Heidi J. , Jacobson Matthew P. , Minor Wladek , Poulter C. Dale , Raushel Frank M. , Sali Andrej , Shoichet Brian K. , Sweedler Jonathan V. The Enzyme Function Initiative  // ​​​​Biochimie. - 2011. - 22 noiembrie ( vol. 50 , nr. 46 ). - S. 9950-9962 . — ISSN 0006-2960 . doi : 10.1021 / bi201312u .
  5. Gandhimathi A. , Nair AG , Sowdhamini R. PASS2 versiunea 4: o actualizare a bazei de date de alinieri de secvențe bazate pe structură ale superfamiliilor de domenii structurale.  (engleză)  // Cercetarea acizilor nucleici. - 2012. - Vol. 40.-P. D531-534. doi : 10.1093 / nar/gkr1096 . — PMID 22123743 .