Promotor

Versiunea actuală a paginii nu a fost încă examinată de colaboratori experimentați și poate diferi semnificativ de versiunea revizuită pe 14 aprilie 2022; verificarea necesită 1 editare .

Promotorul ( ing.  promotor ) este o secvență de nucleotide ADN recunoscută de ARN polimerază ca o rampă de lansare pentru a începe transcripția . Promotorul joacă unul dintre rolurile cheie în procesul de inițiere a transcripției [1] .

Informații generale

De obicei, promotorul este situat în jurul punctului de începere a transcripției - prima nucleotidă din care se obține transcriptul, care are o coordonată de +1 (nucleotida anterioară este notată cu -1). Promotorul include de obicei un număr de motive care sunt importante pentru recunoașterea sa de către ARN polimerază. În special, elementele -10 și -35 în bacterii , cutia TATA la eucariote [1] .

Promotorul este asimetric, permițând ARN polimerazei să înceapă transcripția în direcția corectă și indicând care dintre cele două catene de ADN va servi ca șablon pentru sinteza ARN . Lanțul șablon de ADN este numit non-coding, în timp ce celălalt lanț codant se potrivește cu ARN-ul rezultat în secvență (excluzând înlocuirea timinei cu uracil ) [1] .

Promotorul sub care se află regiunea codificatoare ARN a ADN-ului joacă un rol decisiv în intensitatea expresiei acestei gene în fiecare tip de celulă specific. După activitate, promotorii sunt împărțiți în constitutivi (nivel constant de transcripție) și inductibili (transcripția depinde de condițiile din celulă, de exemplu, prezența anumitor substanțe sau prezența șocului termic). Activarea promotorului este determinată de prezența unui set de factori de transcripție [1] .

Structura promotorilor

În bacterii

Miezul bacterian ARN polimeraza (format din subunități α2ββ'ω) poate iniția transcripția oriunde în genom. Cu toate acestea, în celulă, inițierea are loc numai în regiunile promotoare. Această specificitate este oferită de subunitatea σ (factorul σ ), care, în complex cu enzima de bază, formează o holoenzimă . Principalul factor σ al celulelor Escherichia coli este subunitatea σ 70 [1] .

Promotorul clasic (σ 70 ) constă din două secvențe conservate de 6 nucleotide lungime, situate în amonte de situsul de începere a transcripției cu 10 și 35 bp, separate de 17 nucleotide. Aceste secvențe se numesc -10 și respectiv -35 elemente . Elementele nu sunt identice la toți promotorii, dar se pot obține secvențe consens pentru ei [1] .

Unii promotori puternici au, de asemenea, un element UP în amonte de elementul -35, care crește nivelul de legare a ARN polimerazei. Unii promotori σ70 nu au elementul -35, ci în schimb au elementul -10 extins până la câteva nucleotide ( extins -10 ). Acesta este promotorul operonului galactoză E. coli . Uneori, sub elementul -10, există un alt element de legătură - discriminatorul [1] .

Subunitățile σ alternative ale ARN polimerazei modifică specificitatea recunoașterii promotorului. De exemplu, subunitatea σ 32 determină recunoașterea promotorilor genelor de răspuns la șoc termic, σ 54 este asociat cu genele de metabolism al azotului [1] .

La eucariote

Celulele eucariote conțin mai multe tipuri de ARN polimeraze. Transcripția ARNm este efectuată de ARN polimeraza II împreună cu un set de factori de transcripție proteici [1] .

Promotorul miezului eucariotic este setul minim de elemente de secvență necesare pentru legarea ARN polimerazei II și a factorilor de transcripție implicați în începerea inițierii transcripției. De obicei, promotorul miez are o lungime de 40-60 pb şi poate fi situat fie deasupra, fie sub punctul de început al transcripţiei. Setul complet de elemente promotoare de bază include elementul BRE , caseta TATA , Inr (inițiator) și/sau elementele din aval (DPE, DCE și MTE). De obicei, promotorul conține o combinație a acestor elemente. De exemplu, caseta DPE și TATA nu apar de obicei în același timp într-un singur promotor. Adesea există o combinație de cutie TATA, DPE și Inr [1] .

element promotor Proteine ​​de legare Coordonatele Secvență de consens
element BRE TFIIB -37 -32 [GC][GC][GA]CGCCC
cutie TATA TBP -31 -26 TATA[AT]A[AT]
Inr TFIID -2 +4 [CT][CT]AN[TA][CT][CT]
DCE I TFIID +6 +11 CTTC
DCE II TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCE III TFIID +30 +34 AGC

De asemenea, pentru ca transcrierea eucariotelor să continue, este necesară interacțiunea cu secvențe reglatoare situate din punctul de plecare al transcripției - secvențe proximale, amplificatoare , amortizoare , izolatoare, elemente de frontieră [1] .

În celulele eucariote, în plus față de ARN polimeraza II, există încă două ARN polimeraze care transcriu ARNr ( ARN polimeraza I este responsabilă de acest lucru ) și ARN-uri necodificatoare , cum ar fi tARN și 5sARN (sunt transcrise de ARN polimeraza III ) [1] ] .

ARN polimeraza I din celulele eucariote transcrie o singură genă precursoare de ARNr , prezentă în multe copii din genom. Promotorul genei ARNr conține elemente de bază (coordonate în jur de -45 + 20) și UCE ( element de control în amonte , coordonate în jur de -150 -100). Inițierea transcripției acestei gene necesită, de asemenea, mai mulți factori de transcripție, TBP, SL1 (constă din proteinele TBP și trei TAF) și UBF. UBF leagă elementul UCE, SF1 leagă promotorul de bază. UBF legat stimulează legarea polimerazei de regiunea promotor de miez [1] .

ARN polimeraza III transcrie genele unora dintre ARN-ul necodificator al celulei ( ARNt , ARN 5s). Promotorii ARN polimerazei III sunt foarte diverși și de obicei se află sub punctul de început al transcripției. Promotorii genelor ARNt, în special, conțin cutii A și B; factorii de transcripție TFIIIB și TFIIIC sunt necesari pentru inițiere. Alți promotori pot conține cutii A și C (de exemplu, 5sARN); factorii de transcripție TFIIIA, TFIIIB, TFIIIC sunt necesari pentru inițiere. Grupul promotor al ARN polimerazei III conține cutii TATA [1] .

Regulamentul promotorilor

Reglarea nivelului de transcripție are loc adesea în stadiul de inițiere, adică de la legarea ARN polimerazei la promotor înainte de începerea alungirii [1] .

Regiunea promotoare din cadrul unui operon în bacterii se poate suprapune sau deloc suprapune cu regiunea operator a unui cistron ( genă ) . La bacterii, legarea de promotor este determinată de partea structurală a polimerazei, subunitatea σ. În reglare sunt adesea implicate și proteinele reglatoare, care pot accelera procesul și pot crește eficiența acestuia (activatori) sau îl pot încetini (represori) [1] .

Transcripția eucariotelor este reglată într-o manieră similară cu cea a bacteriilor (datorită proteinelor reglatoare diferite), dar și diferită. Genele eucariote nu formează operoni; fiecare genă are propriul său promotor. Eucariotele au cromatina compusă din ADN și nucleozomi. Atât ADN-ul, cât și nucleozomii pot suferi modificări chimice care afectează nivelul transcripției. De asemenea, alte regiuni ADN, precum amplificatorii, amortizoarele, izolatorii, elementele de limită, sunt implicate în reglarea promotorilor la eucariote [1] .

Exemple de promotori

Secvențele și caracteristicile de reglare ale multor promotori din diferite organisme vii sunt acum bine înțelese. Aceste cunoștințe sunt utilizate pe scară largă în crearea de constructe genetice de bioinginerie ( plasmide , vectori ). Pentru exprimarea produsului în celule bacteriene sau eucariote, se poate folosi atât un promotor caracteristic acestui grup de organisme găsit în genom, cât și un promotor, de exemplu, de la virusurile care infectează acest organism [1] .

Exemple clasice de operoni bacterieni cu reglarea cunoscută a promotorilor procarioți sunt: ​​promotorul de lactoză, promotorul de triptofan, promotorul de arabinoză , operonul GABA , operonul galactoză . Promotorii celulei eucariote bine studiati sunt promotorul GAL1 de drojdie, promotorul tetraciclină TRE inductibil și promotorul edchizonă inductibil. În genomul viral, precum și în cele pro- și eucariote, există promotori, de exemplu, promotorul fagului T5, promotorul fagului T7, promotorii constitutivi ai virusurilor SV40 (virusul poliomului), RSV, CMV (citomegalovirusul) [1] .

Predicția regiunii promotorului

Adesea, algoritmii de predicție a promotorului produc un număr mare de false pozitive (predice secvențe de promotori care nu sunt promotori). De exemplu, în medie, diverși algoritmi prezic un promotor la 1000 bp, în timp ce genomul uman conține aproximativ o genă la 30.000-40.000 bp. [2] Acest rezultat se datorează faptului că mulți factori trebuie luați în considerare la prezicerea promotorilor [2] :

În ciuda dificultăților descrise mai sus, există mulți algoritmi pentru prezicerea regiunilor promotoare în diferite organisme. Tabelul de mai jos prezintă câteva dintre ele.

Numele algoritmului Cum funcționează algoritmul Ce prezice algoritmul
TSSW [3] Algoritmul prezice site-uri potențiale de începere a transcripției folosind o funcție discriminantă liniară care combină caracteristicile care descriu motivele funcționale și compoziția oligonucleotidică a acestor situsuri. TSSW folosește baza de date funcțională a site-ului TRANSFAC (elaborată de E. Wingender [4] , de unde ultima literă din numele metodei TSSW). Regiunea promotor uman PolII.
TSSG [3] /Fprom [3] Algoritmul TSSG funcționează în același mod ca TSSW, dar folosește o bază de date diferită, TFD [5] . Fprom este același TSSG antrenat pe un set diferit de secvențe promotoare. TSSG, regiunea promotor uman PolII; Fprom, regiunea promotor uman.
TSSP [3] Algoritmul funcționează în același mod ca TSSW, folosind baza de date a elementelor de reglementare a plantelor RegSite [6] . În același timp, algoritmul a fost antrenat pe secvențele regiunilor promotoare ale plantelor. regiunea promotoare a plantelor.
PIPER [7] Algoritmul prezice regiunea promotorului pe baza unei matrice de greutate pozițională curată și a modelului Markov ascuns pentru secvențele consens -35 și -10, precum și pe diferite situsuri de legare ale Bacillus subtilis și Escherichia coli (luate ca reprezentanți ai Gram-pozitive și Gram - bacterii negative, respectiv). Regiunea promotoare a procariotelor (adecvată în principal pentru genomii bacterieni).
PromoterInspector [8] Algoritmul euristic se bazează pe mediul genomic al regiunii promotoare a unui eșantion de secvențe de mamifere. Regiunea promotor PolII a mamiferelor.
BPROM [3] Algoritmul funcționează în același mod ca TSSW, folosind baza de date funcțională a site -ului DPInteract [9] . σ 70 Regiunea promotor E. coli .
NNPP 2.2 [10] Programul este o rețea neuronală cu întârziere, care constă din două straturi funcționale, unul pentru recunoașterea casetei TATA și unul pentru recunoașterea elementelor Inr. Regiunea promotoare a eucariotelor și procariotelor.
G4PromFinder [11] Algoritmul identifică promotori presupuși bazați pe elemente bogate în AT și motive G-quadruplex ADN în regiunea bogată în GC. Regiunea promotoare a bacteriilor.

Odată cu creșterea numărului de regiuni promotoare prezise, ​​prezentate experimental, ale diferitelor organisme, a devenit necesară crearea unei baze de date cu secvențe promotoare. Cea mai mare bază de date de secvențe promotoare eucariote (în principal vertebrate) este Baza de date pentru promotori eucarioți [12] . Baza de date este împărțită în două părți. Prima (EPD) este o colecție curată de secvențe de promotor obținute prin prelucrarea datelor experimentale, a doua (EPDnew) este rezultatul îmbinării informațiilor despre promotor din baza de date EPD cu analiza datelor din metodele de secvențiere cu randament ridicat. Cu ajutorul metodelor de mare performanță de obținere a transcriptomilor s-a putut obține un set de promotori pentru unii reprezentanți ai plantelor și ciupercilor: Arabidopsis thaliana (Tal's coli), Zea mays (Porumb zaharat), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13]. ] .

Note

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Watson JD, Baker TA, Bell SP, Gann AA, Levine M., Losick RM Molecular Biology of the  Gene . — al 7-lea. — Pearson, 2014.
  2. 1 2 Pedersen Anders Gorm , Baldi Pierre , Chauvin Yves , Brunak Søren. Biologia predicției promotorului eucariotic - o revizuire  //  Computere și chimie. - 1999. - iunie ( vol. 23 , nr. 3-4 ). - P. 191-207 . — ISSN 0097-8485 . - doi : 10.1016/S0097-8485(99)00015-7 .
  3. 1 2 3 4 5 Solovyev Victor V. , Shahmuradov Ilham A. , Salamov Asaf A. Identificarea regiunilor promotoare și a site-urilor de reglementare  (engleză)  // Methods in Molecular Biology. - 2010. - P. 57-83 . — ISBN 9781607618539 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60761-854-6_5 .
  4. Wingender E. TRANSFAC : o bază de date despre factorii de transcripție și site-urile lor de legare la ADN  //  Nucleic Acids Research. - 1996. - 1 ianuarie ( vol. 24 , nr. 1 ). - P. 238-241 . — ISSN 1362-4962 . doi : 10.1093 / nar/24.1.238 .
  5. David Ghosh. O bază de date relațională a factorilor de transcripție  //  Nucleic Acids Research. - 1990. - Vol. 18 , nr. 7 . - P. 1749-1756 . — ISSN 0305-1048 . - doi : 10.1093/nar/18.7.1749 .
  6. Baza de date RegSite . SoftBerry . Preluat la 7 aprilie 2019. Arhivat din original pe 22 octombrie 2019.
  7. de Jong Anne , Pietersma Hilco , Cordes Martijn , Kuipers Oscar P , Kok Jan. PePPER: un server web pentru predicția elementelor promotoare și a regulonilor procariote  //  BMC Genomics. - 2012. - Vol. 13 , nr. 1 . — P. 299 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-13-299 .
  8. Scherf Matthias , Klingenhoff Andreas , Werner Thomas. Localizarea foarte specifică a regiunilor promotoare în secvențe genomice mari de către PromoterInspector: o nouă abordare de analiză a contextului  //  Journal of Molecular Biology. - 2000. - Martie ( vol. 297 , nr. 3 ). - P. 599-606 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.2000.3589 .
  9. Robison Keith , McGuire Abigail Manson , Church George M. O bibliotecă cuprinzătoare de matrice de site-uri de legare a ADN-ului pentru 55 de proteine ​​aplicate la genomul complet al Escherichia coli K-12 1 1Editat de R. Ebright  //  Journal of Molecular Biology. - 1998. - noiembrie ( vol. 284 , nr. 2 ). - P. 241-254 . — ISSN 0022-2836 . - doi : 10.1006/jmbi.1998.2160 .
  10. Burden S. , Lin Y.-X. , Zhang R. Îmbunătățirea predicției promotorului Îmbunătățirea predicției promotorului pentru algoritmul NNPP2.2: un studiu de caz folosind secvențe ADN Escherichia coli   // Bioinformatică . - 2004. - 28 septembrie ( vol. 21 , nr. 5 ). - P. 601-607 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/bti047 .
  11. Di Salvo Marco , Pinatel Eva , Talà Adelfia , Fondi Marco , Peano Clelia , Alifano Pietro. G4PromFinder: un algoritm pentru prezicerea promotorilor de transcripție în genomii bacterieni bogati în GC bazat pe elemente bogate în AT și motive G-quadruplex  //  BMC Bioinformatics. - 2018. - 6 februarie ( vol. 19 , nr. 1 ). — ISSN 1471-2105 . - doi : 10.1186/s12859-018-2049-x .
  12. Cavin Perier R. The Eukaryotic Promoter Database EPD  //  Nucleic Acids Research. - 1998. - 1 ianuarie ( vol. 26 , nr. 1 ). - P. 353-357 . — ISSN 1362-4962 . doi : 10.1093 / nar/26.1.353 .
  13. Dreos René , Ambrosini Giovanna , Groux Romain , Cavin Périer Rouaïda , Bucher Philipp. Baza de date a promotorilor eucarioți în al 30-lea an: concentrare pe organisme nevertebrate  //  Cercetarea acizilor nucleici. - 2016. - 28 noiembrie ( vol. 45 , nr. D1 ). -P.D51- D55 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkw1069 .