Promotorul ( ing. promotor ) este o secvență de nucleotide ADN recunoscută de ARN polimerază ca o rampă de lansare pentru a începe transcripția . Promotorul joacă unul dintre rolurile cheie în procesul de inițiere a transcripției [1] .
De obicei, promotorul este situat în jurul punctului de începere a transcripției - prima nucleotidă din care se obține transcriptul, care are o coordonată de +1 (nucleotida anterioară este notată cu -1). Promotorul include de obicei un număr de motive care sunt importante pentru recunoașterea sa de către ARN polimerază. În special, elementele -10 și -35 în bacterii , cutia TATA la eucariote [1] .
Promotorul este asimetric, permițând ARN polimerazei să înceapă transcripția în direcția corectă și indicând care dintre cele două catene de ADN va servi ca șablon pentru sinteza ARN . Lanțul șablon de ADN este numit non-coding, în timp ce celălalt lanț codant se potrivește cu ARN-ul rezultat în secvență (excluzând înlocuirea timinei cu uracil ) [1] .
Promotorul sub care se află regiunea codificatoare ARN a ADN-ului joacă un rol decisiv în intensitatea expresiei acestei gene în fiecare tip de celulă specific. După activitate, promotorii sunt împărțiți în constitutivi (nivel constant de transcripție) și inductibili (transcripția depinde de condițiile din celulă, de exemplu, prezența anumitor substanțe sau prezența șocului termic). Activarea promotorului este determinată de prezența unui set de factori de transcripție [1] .
Miezul bacterian ARN polimeraza (format din subunități α2ββ'ω) poate iniția transcripția oriunde în genom. Cu toate acestea, în celulă, inițierea are loc numai în regiunile promotoare. Această specificitate este oferită de subunitatea σ (factorul σ ), care, în complex cu enzima de bază, formează o holoenzimă . Principalul factor σ al celulelor Escherichia coli este subunitatea σ 70 [1] .
Promotorul clasic (σ 70 ) constă din două secvențe conservate de 6 nucleotide lungime, situate în amonte de situsul de începere a transcripției cu 10 și 35 bp, separate de 17 nucleotide. Aceste secvențe se numesc -10 și respectiv -35 elemente . Elementele nu sunt identice la toți promotorii, dar se pot obține secvențe consens pentru ei [1] .
Unii promotori puternici au, de asemenea, un element UP în amonte de elementul -35, care crește nivelul de legare a ARN polimerazei. Unii promotori σ70 nu au elementul -35, ci în schimb au elementul -10 extins până la câteva nucleotide ( extins -10 ). Acesta este promotorul operonului galactoză E. coli . Uneori, sub elementul -10, există un alt element de legătură - discriminatorul [1] .
Subunitățile σ alternative ale ARN polimerazei modifică specificitatea recunoașterii promotorului. De exemplu, subunitatea σ 32 determină recunoașterea promotorilor genelor de răspuns la șoc termic, σ 54 este asociat cu genele de metabolism al azotului [1] .
Celulele eucariote conțin mai multe tipuri de ARN polimeraze. Transcripția ARNm este efectuată de ARN polimeraza II împreună cu un set de factori de transcripție proteici [1] .
Promotorul miezului eucariotic este setul minim de elemente de secvență necesare pentru legarea ARN polimerazei II și a factorilor de transcripție implicați în începerea inițierii transcripției. De obicei, promotorul miez are o lungime de 40-60 pb şi poate fi situat fie deasupra, fie sub punctul de început al transcripţiei. Setul complet de elemente promotoare de bază include elementul BRE , caseta TATA , Inr (inițiator) și/sau elementele din aval (DPE, DCE și MTE). De obicei, promotorul conține o combinație a acestor elemente. De exemplu, caseta DPE și TATA nu apar de obicei în același timp într-un singur promotor. Adesea există o combinație de cutie TATA, DPE și Inr [1] .
element promotor | Proteine de legare | Coordonatele | Secvență de consens |
---|---|---|---|
element BRE | TFIIB | -37 -32 | [GC][GC][GA]CGCCC |
cutie TATA | TBP | -31 -26 | TATA[AT]A[AT] |
Inr | TFIID | -2 +4 | [CT][CT]AN[TA][CT][CT] |
DCE I | TFIID | +6 +11 | CTTC |
DCE II | TFIID | +16 +21 | CTGT |
MTE | +21 +28 | ||
DPE | TFIID | +28 +32 | [AG]G[AT]CGTG |
DCE III | TFIID | +30 +34 | AGC |
De asemenea, pentru ca transcrierea eucariotelor să continue, este necesară interacțiunea cu secvențe reglatoare situate din punctul de plecare al transcripției - secvențe proximale, amplificatoare , amortizoare , izolatoare, elemente de frontieră [1] .
În celulele eucariote, în plus față de ARN polimeraza II, există încă două ARN polimeraze care transcriu ARNr ( ARN polimeraza I este responsabilă de acest lucru ) și ARN-uri necodificatoare , cum ar fi tARN și 5sARN (sunt transcrise de ARN polimeraza III ) [1] ] .
ARN polimeraza I din celulele eucariote transcrie o singură genă precursoare de ARNr , prezentă în multe copii din genom. Promotorul genei ARNr conține elemente de bază (coordonate în jur de -45 + 20) și UCE ( element de control în amonte , coordonate în jur de -150 -100). Inițierea transcripției acestei gene necesită, de asemenea, mai mulți factori de transcripție, TBP, SL1 (constă din proteinele TBP și trei TAF) și UBF. UBF leagă elementul UCE, SF1 leagă promotorul de bază. UBF legat stimulează legarea polimerazei de regiunea promotor de miez [1] .
ARN polimeraza III transcrie genele unora dintre ARN-ul necodificator al celulei ( ARNt , ARN 5s). Promotorii ARN polimerazei III sunt foarte diverși și de obicei se află sub punctul de început al transcripției. Promotorii genelor ARNt, în special, conțin cutii A și B; factorii de transcripție TFIIIB și TFIIIC sunt necesari pentru inițiere. Alți promotori pot conține cutii A și C (de exemplu, 5sARN); factorii de transcripție TFIIIA, TFIIIB, TFIIIC sunt necesari pentru inițiere. Grupul promotor al ARN polimerazei III conține cutii TATA [1] .
Reglarea nivelului de transcripție are loc adesea în stadiul de inițiere, adică de la legarea ARN polimerazei la promotor înainte de începerea alungirii [1] .
Regiunea promotoare din cadrul unui operon în bacterii se poate suprapune sau deloc suprapune cu regiunea operator a unui cistron ( genă ) . La bacterii, legarea de promotor este determinată de partea structurală a polimerazei, subunitatea σ. În reglare sunt adesea implicate și proteinele reglatoare, care pot accelera procesul și pot crește eficiența acestuia (activatori) sau îl pot încetini (represori) [1] .
Transcripția eucariotelor este reglată într-o manieră similară cu cea a bacteriilor (datorită proteinelor reglatoare diferite), dar și diferită. Genele eucariote nu formează operoni; fiecare genă are propriul său promotor. Eucariotele au cromatina compusă din ADN și nucleozomi. Atât ADN-ul, cât și nucleozomii pot suferi modificări chimice care afectează nivelul transcripției. De asemenea, alte regiuni ADN, precum amplificatorii, amortizoarele, izolatorii, elementele de limită, sunt implicate în reglarea promotorilor la eucariote [1] .
Secvențele și caracteristicile de reglare ale multor promotori din diferite organisme vii sunt acum bine înțelese. Aceste cunoștințe sunt utilizate pe scară largă în crearea de constructe genetice de bioinginerie ( plasmide , vectori ). Pentru exprimarea produsului în celule bacteriene sau eucariote, se poate folosi atât un promotor caracteristic acestui grup de organisme găsit în genom, cât și un promotor, de exemplu, de la virusurile care infectează acest organism [1] .
Exemple clasice de operoni bacterieni cu reglarea cunoscută a promotorilor procarioți sunt: promotorul de lactoză, promotorul de triptofan, promotorul de arabinoză , operonul GABA , operonul galactoză . Promotorii celulei eucariote bine studiati sunt promotorul GAL1 de drojdie, promotorul tetraciclină TRE inductibil și promotorul edchizonă inductibil. În genomul viral, precum și în cele pro- și eucariote, există promotori, de exemplu, promotorul fagului T5, promotorul fagului T7, promotorii constitutivi ai virusurilor SV40 (virusul poliomului), RSV, CMV (citomegalovirusul) [1] .
Adesea, algoritmii de predicție a promotorului produc un număr mare de false pozitive (predice secvențe de promotori care nu sunt promotori). De exemplu, în medie, diverși algoritmi prezic un promotor la 1000 bp, în timp ce genomul uman conține aproximativ o genă la 30.000-40.000 bp. [2] Acest rezultat se datorează faptului că mulți factori trebuie luați în considerare la prezicerea promotorilor [2] :
În ciuda dificultăților descrise mai sus, există mulți algoritmi pentru prezicerea regiunilor promotoare în diferite organisme. Tabelul de mai jos prezintă câteva dintre ele.
Numele algoritmului | Cum funcționează algoritmul | Ce prezice algoritmul |
---|---|---|
TSSW [3] | Algoritmul prezice site-uri potențiale de începere a transcripției folosind o funcție discriminantă liniară care combină caracteristicile care descriu motivele funcționale și compoziția oligonucleotidică a acestor situsuri. TSSW folosește baza de date funcțională a site-ului TRANSFAC (elaborată de E. Wingender [4] , de unde ultima literă din numele metodei TSSW). | Regiunea promotor uman PolII. |
TSSG [3] /Fprom [3] | Algoritmul TSSG funcționează în același mod ca TSSW, dar folosește o bază de date diferită, TFD [5] . Fprom este același TSSG antrenat pe un set diferit de secvențe promotoare. | TSSG, regiunea promotor uman PolII; Fprom, regiunea promotor uman. |
TSSP [3] | Algoritmul funcționează în același mod ca TSSW, folosind baza de date a elementelor de reglementare a plantelor RegSite [6] . În același timp, algoritmul a fost antrenat pe secvențele regiunilor promotoare ale plantelor. | regiunea promotoare a plantelor. |
PIPER [7] | Algoritmul prezice regiunea promotorului pe baza unei matrice de greutate pozițională curată și a modelului Markov ascuns pentru secvențele consens -35 și -10, precum și pe diferite situsuri de legare ale Bacillus subtilis și Escherichia coli (luate ca reprezentanți ai Gram-pozitive și Gram - bacterii negative, respectiv). | Regiunea promotoare a procariotelor (adecvată în principal pentru genomii bacterieni). |
PromoterInspector [8] | Algoritmul euristic se bazează pe mediul genomic al regiunii promotoare a unui eșantion de secvențe de mamifere. | Regiunea promotor PolII a mamiferelor. |
BPROM [3] | Algoritmul funcționează în același mod ca TSSW, folosind baza de date funcțională a site -ului DPInteract [9] . | σ 70 Regiunea promotor E. coli . |
NNPP 2.2 [10] | Programul este o rețea neuronală cu întârziere, care constă din două straturi funcționale, unul pentru recunoașterea casetei TATA și unul pentru recunoașterea elementelor Inr. | Regiunea promotoare a eucariotelor și procariotelor. |
G4PromFinder [11] | Algoritmul identifică promotori presupuși bazați pe elemente bogate în AT și motive G-quadruplex ADN în regiunea bogată în GC. | Regiunea promotoare a bacteriilor. |
Odată cu creșterea numărului de regiuni promotoare prezise, prezentate experimental, ale diferitelor organisme, a devenit necesară crearea unei baze de date cu secvențe promotoare. Cea mai mare bază de date de secvențe promotoare eucariote (în principal vertebrate) este Baza de date pentru promotori eucarioți [12] . Baza de date este împărțită în două părți. Prima (EPD) este o colecție curată de secvențe de promotor obținute prin prelucrarea datelor experimentale, a doua (EPDnew) este rezultatul îmbinării informațiilor despre promotor din baza de date EPD cu analiza datelor din metodele de secvențiere cu randament ridicat. Cu ajutorul metodelor de mare performanță de obținere a transcriptomilor s-a putut obține un set de promotori pentru unii reprezentanți ai plantelor și ciupercilor: Arabidopsis thaliana (Tal's coli), Zea mays (Porumb zaharat), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13]. ] .
Dicționare și enciclopedii | |
---|---|
În cataloagele bibliografice |
Transcriere (biologie) | |||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Reglementarea transcripției |
| ||||||||||||
Activare | |||||||||||||
Iniţiere | Site de începere a transcripției | ||||||||||||
Elongaţie |
| ||||||||||||
Încetarea |