Regiunile netraduse ( NTR , English untranslated regions, UTR ) sunt regiuni speciale de ARNm care nu acționează ca un șablon pentru sinteza proteinelor și sunt adiacente pe ambele părți cu regiunea tradusă (adică cea pe șablonul căreia este sintetizată proteina). ). Există două astfel de regiuni: 5'-regiune netradusă sau 5'- UTR ( ing. 5'-regiune netradusă, 5'UTR ) şi 3'-regiune netradusă sau 3'- UTR ( ing. 3'-regiune netradusă , 3 'UTR ) situat la capătul 5'- şi respectiv 3'-terminal al ARNm, respectiv [1] . Segmentele de ADN corespunzătoare 5’-UTR și 3’-UTR ale transcriptului au același nume [2] .
Regiunile netraduse sunt implicate în reglarea localizării, traducerii și degradarii transcripției în care sunt situate. Ele sunt caracterizate prin prezența acelor de păr , codoni inițiatori interni și cadre deschise de citire , situsuri de legare a ribozomilor , diferite elemente de reglare cis care se leagă de proteinele de legare a ARN -ului [3] . Deci, ele conțin elemente precum IRES , uORF , ARE [3] , secvența Shine-Dalgarno , riboswitch și altele [4] .
Analiza genomilor diferitelor organisme a arătat prezența unui număr de proprietăți conservatoare inerente regiunilor netraduse. Lungimea totală a 5'-UTR este aproximativ aceeași între toate grupurile taxonomice de eucariote și variază de la 100 la 200 de nucleotide (cu toate acestea, în drojdia Schizosaccharomyces pombe , lungimea 5'-UTR din transcrierea ste11 este de 2273 de nucleotide. [5] ). În același timp, lungimea 3’-UTR este mult mai variabilă și poate varia de la 200 de nucleotide la plante și unele animale până la 800 de nucleotide la oameni și alte vertebrate . Surprinzător este faptul că lungimea ambelor 5’- și 3’-UTR variază semnificativ în cadrul aceleiași specii : poate lua o valoare de la 12 la câteva mii de nucleotide [6] . Într-adevăr, s-a demonstrat într-un sistem in vitro care modelează aparatul genetic al mamiferelor că chiar și un 5’-UTR de 1 nucleotidă poate asigura inițierea normală a translației [7] .
O secțiune de ADN genomic corespunzătoare regiunilor netraduse ale ARNm poate conține introni și mai des în regiunea 5’ decât în regiunea 3’. Aproximativ 30% din genele Metazoa au regiuni corespunzătoare 5’-UTR, constând doar din exoni , în timp ce 3’-UTR, deși este mai lung, are mult mai puțini introni. Proporția totală a lungimii intronilor față de lungimea totală în 3'-UTR este de 1-11%. Formarea de regiuni alternative netraduse are loc folosind diferite site-uri de început a transcripției, poliadenilare și splicing . În funcție de țesut , stadiul de dezvoltare , prezența unei stări de boală, numărul de regiuni alternative netraduse se poate modifica și pot afecta semnificativ expresia anumitor gene [8] .
Compoziția de bază diferă, de asemenea, în 3'- și 5'-UTR. De exemplu, conținutul de G + C este mai mare în 5'-UTR decât în 3'-UTR. Această diferență este vizibilă în special în ARNm al vertebratelor cu sânge cald , în care conținutul de G+C în 5’-UTR este de 60%, iar în 3’-UTR este de 45% [6] . Există, de asemenea, o relație certă între conținutul de G+C în 5’-UTR și 3’-UTR și pozițiile a treia din codonii regiunii traduse corespunzătoare. O relație inversă importantă a fost găsită și între conținutul G+C al 5’-UTR și 3’-UTR și lungimile acestora [9] . În special, se știe că genele situate în regiunile cromozomilor bogate în GC (izocori grei) au 5'-UTR și 3'-UTR-uri mai scurte decât genele situate în izocorii mai săraci în GC. O relație similară a fost demonstrată pentru secvențele de codare și introni [10] .
În cele din urmă, în regiunile netraduse ale ARNm eucariotic, a fost găsită prezența secvențelor repetate de diferite tipuri, de exemplu, SINE (inclusiv repetiții Alu ) și LINE , minisateliți și microsateliți . La om, repetele ARNm sunt 12% 5'-UTR și 36% 3'-UTR; la alți taxoni, inclusiv alte mamifere , s-a arătat un conținut mai scăzut de repetări [3] .
Regiunile netraduse îndeplinesc funcții cheie în reglarea post-transcripțională a expresiei genelor, inclusiv modularea transportului ARNm din nucleu , reglarea localizării ARNm intracelulare [11] , stabilitatea acestuia [12] și eficiența translației [13] . Regiunile netraduse pot juca, de asemenea, un rol în alte procese, de exemplu, în includerea co -translațională a aminoacidului nestandard selenocisteină la codonul UGA (de obicei un codon stop) al ARNm care codifică selenoproteine (acest proces implică o conservare ). ac de păr situat în elementul 3'-UTR - SECIS ) [14] . Importanța regiunilor netraduse în reglarea expresiei genelor este confirmată și de faptul că mutațiile care afectează aceste regiuni pot duce la patologii grave [15] (pentru mai multe detalii despre bolile cauzate de mutațiile din NTR, vezi mai jos).
Reglarea de către regiunile ARNm netraduse poate fi mediată în mai multe moduri. Motivele nucleotidice localizate la 3'-UTR și 5'-UTR pot interacționa cu proteine specifice de legare a ARN-ului. Spre deosebire de elementele de reglare localizate în ADN, în care structura primară a ADN-ului (adică secvența de nucleotide) joacă un rol principal, activitatea biologică a motivelor de reglare localizate pe ARN este determinată atât de structurile lor primare, cât și de cele secundare . De asemenea, au fost demonstrate roluri cheie în reglare pentru interacțiunile dintre regiunile regiunilor netraduse și ARN-uri necodificatoare complementare specifice , în special miARN [16] . În cele din urmă, sunt cunoscute exemple de elemente repetate care sunt importante pentru reglarea expresiei genelor la nivel de ARN, de exemplu, proteinele care leagă CUG pot interacționa cu repetele CUG în 5’-UTR al unui ARNm specific (de exemplu, codifică factorul de transcripție C/EBPβ) și astfel afectează eficiența traducerii [17] .
Eficiența traducerii ARNm poate fi diferită, prin urmare, este posibilă reglarea cantității de proteină rezultată. Acesta este un mecanism important pentru reglarea expresiei genelor. Într-adevăr, numai pentru proteinele secretate există o relație clară între cantitatea de ARNm și proteină (cu cât mai multe ARNm, cu atât mai multe proteine). În proteinele destinate utilizării intracelulare, această relație este în mare măsură distorsionată de ratele diferite de traducere ale diferitelor ARNm [18] .
Caracteristicile structurale ale 5’-UTR sunt importante pentru controlul translației. S-a demonstrat că ARNm care codifică proteine implicate în procesele de dezvoltare, de exemplu, factorii de creștere, factorii de transcripție sau produsele proto-oncogene (proteine care necesită un control precis al expresiei), au un 5’-UTR mai lung decât media [19] , care conțin codoni de inițiere (codoni de inițiere în amonte în engleză ) și cadre de citire deschise , precum și elemente stabile ale structurii secundare care împiedică procesul de traducere (de exemplu, cvadruplexuri ). Alte motive specifice și elemente de structură secundară ale 5'-UTR pot modula eficiența translației [3] .
În mod normal, după ce ARNm se deplasează de la nucleu la citoplasmă , complexul proteic eIF4F este asamblat în regiunea capac situată la capătul 5' al ARNm. Acest complex include 3 subunități: eIF4E (proteina de legare a capacului); eIF4A cu activitate helicaza ; eIF4G interacționează cu diverse alte proteine, inclusiv poliadenilat - proteina de legare. Activitatea helicazei dependentă de ATP a eIF4A, stimulată de proteina de legare a ARN-ului eIF4B, asigură derularea oricăror elemente ale structurii secundare ARNm, rezultând în formarea unui „site de aterizare” pentru subunitatea ribozomului mic (40S) [20]. ] . Dacă translația este constrânsă de numărul de ribozomi sau de concentrația factorilor de translație, coada 3’-poli(A) poate interacționa cu capacul 5’, îmbunătățind inițierea translației prin introducerea unei proteine de legare a poliadenilatului care poate interacționa cu complex eIF4F [21] .
Se crede că în ARNm eucariote , traducerea începe cu primul codon AUG (codon de început) pe care ribozomul îl întâlnește de-a lungul căii sale de la capătul 5’ la capătul 3’. Secvențele care înconjoară codonii de pornire sunt non-aleatorie și constituie secvența consens Kozak . La mamifere, această secvență este: , iar cele mai conservate nucleotide sunt R ( purină , de obicei A ) la poziția -3 din AUG și G la poziția +4 din AUG. Aranjarea strictă a lui A în poziția -3 și G în poziția +4 este, de asemenea, caracteristică altor animale, plante și ciuperci . Secvențele care constituie mediul AUG (extinzându-se parțial în regiunea netradusă) pot modula eficiența translației prin furnizarea unui mediu adecvat pentru inițiere [3] . GCCRCCaugG
Trebuie remarcat faptul că 15% până la 50% din 5'-UTR conțin intern codonul de pornire AUG. Prin urmare, regula conform căreia ribozomul începe translația de la primul codon de start pe care îl întâlnește atunci când se deplasează de la capătul 5’ la capătul 3’ al ARNm nu este întotdeauna îndeplinită. Aceasta înseamnă că uneori ribozomul poate sări peste tripleții AUG pe care îi întâlnește și să înceapă translația de la un codon de început mai îndepărtat, posibil pentru că acești tripleți au un mediu de nucleotide „slab”. Astfel, mai multe proteine diferite pot fi sintetizate dintr-un ARNm [22] . Mai mult, s-a constatat că prezența codonilor AUG interni în 5’-UTR se corelează cu o lungime crescută a acestei regiuni și un mediu „mai slab” al codonului de început utilizat în mod obișnuit, iar în transcrierile cu un mediu optim pentru începutul AUG. , regiunea 5’-netradusă este scurtă și nu conține AUG. [23] . În acest sens, AUG-urile din 5'-UTR pot reduce nivelul de traducere a ARNm-ului lor.
Dacă în 5'-UTR după AUG intern, dar înainte de codonul de pornire principal, există un codon de oprire intern, atunci se formează un cadru scurt de citire deschis ( cadru de citire deschis în amonte engleză , uORF ). După translația uORF și disocierea de ARNm a subunității mari de ribozom (60S), soarta subunității mici poate fi diferită, iar acest lucru poate afecta eficiența translației și stabilitatea ARNm. Subunitatea mică poate rămâne pe ARNm, poate relua citirea și începe traducerea din codonul AUG subiacent sau poate părăsi ARNm și, prin urmare, poate scădea nivelul de traducere a cadrului principal de citire deschis. La eucariote, capacitatea ribozomului de a relua translația este limitată, în primul rând, de codonii stop [24] și, în al doilea rând, de lungimea uORF: dacă lungimea uORF depășește 30 de codoni [25] , ribozomul nu va putea relua. traducere. În acest fel, traducerea ARNm-urilor care conțin uORF-uri care codifică factorii de transcripție de drojdie GCN 4 și YAP 1 este blocată [26] .
Structura secundară a 5’-UTR joacă un rol important în reglarea translației. Datele experimentale arată că elementele moderat stabile ale structurii secundare (valoarea energiei libere variază ΔG peste -30 kcal/mol), care conțin direct codonul de start AUG, nu opresc subunitatea mică a ribozomului. Structurile foarte stabile (ΔG sub −50 kcal/mol) au un efect semnificativ asupra eficienței translației, reducând-o. O creștere a concentrației eIF4A contribuie la depășirea influenței unor astfel de structuri [27] .
Există un mecanism alternativ de iniţiere a translaţiei care nu este asociat cu capacul 5'. A fost descris pentru prima dată în picornavirusuri [28] . În acest caz, în interiorul 5’-UTR există o secvență specială care servește la legarea ribozomului - IRES . Ulterior, IRES au fost găsite în multe ARNm celulare care codifică proteine de reglare, de exemplu, produse proto-oncogene c-Myc , proteine homeodomaine , factori de creștere (de exemplu, factor de creștere a fibroblastelor FGF2 [ ), precum și receptorii acestora [3] . Analiza comparativă a IRES-urilor celulare cunoscute a făcut posibilă izolarea unui motiv structural comun caracteristic ARNm-urilor care le conțin. În special, pentru ARNm al proteinei de legare a lanțului greu de imunoglobuline (BiP) și ARNm al proteinei FGF-2, a fost descris un ac de păr în formă de Y , situat imediat înainte de codonul de start AUG [29] . S-a stabilit că motivele structurale scurte complementare ARN - ului ribozomal mic pot acționa și ca IRES [30] .
Secvențele care sunt ținte ale proteinelor de legare a ARN-ului care funcționează trans pot fi, de asemenea, implicate în reglarea translației. De exemplu, elementul sensibil la fier IRE ( element sensibil la fier ) localizat în proteinele care codifică ARNm 5'-UTR implicate în metabolismul fierului ( feritina , 5-aminolevulinat sintaza și aconitaza ) poate bloca translația. În acest caz, are loc legarea dependentă de fier a proteinelor din metabolismul fierului, ceea ce suprimă scanarea normală a ARNm, efectuată de subunitatea mică a ribozomului în timpul inițierii translației. În cele din urmă, majoritatea ARNm de vertebrate care codifică proteine ribozomale și factori de alungire a translației conțin un tract oligopirimidinic terminal (TOP) 5 ' imediat adiacent capacului. Acest tract este necesar pentru reprimarea translațională coordonată în timpul creșterii, diferențierii și întârzierilor de dezvoltare și este, de asemenea, activat de anumite medicamente [31] .
Soarta ARNm-urilor este un alt punct cheie în reglarea post-transcripțională a expresiei genelor, deoarece în absența distrugerii anumitor ARNm, numărul acestora va crește, ceea ce înseamnă că cantitatea de proteine pe care o codifică va crește, ceea ce poate afecta expresia. a anumitor gene. Au fost propuse mai multe mecanisme posibile de degradare a ARNm: degradarea acestuia poate fi declanșată prin scurtarea sau detașarea cozii 3’-poli(A) sau a capacului 5’ [32] . Soarta ARNm este reglată în principal de elementele de reglare cis localizate în 3'-UTR, cum ar fi elementele bogate în AU ( ARE ), care declanșează degradarea ARNm sub influența diferitelor semnale intra și extracelulare. Conform datelor experimentale disponibile, ARE-urile au fost împărțite în 3 clase: membrii clasei I și II se caracterizează prin prezența mai multor copii ale pentanucleotidei AUUUA, care nu este prezentă la membrii clasei III [33] . ARE de clasa I controlează deadenilarea citoplasmatică prin degradarea întregii coadă poli(A) la aceeași viteză pentru toate transcrierile, mai întâi formând intermediari cu o coadă poli(A) de 30-60 de nucleotide, care sunt apoi complet degradate. Astfel de elemente se găsesc în principal în ARNm care codifică factori de transcripție nucleari, cum ar fi c-Fos și c-Myc (produse ale genelor „răspuns rapid”), precum și ARNm care codifică anumite citokine , cum ar fi interleukinele 4 și 6 . O caracteristică structurală a ARE de clasă I este prezența uneia sau mai multor copii ale pentanucleotidei AUUUAdupă regiunea bogată în U. ARE de clasa II conduce deadenilarea citoplasmatică asincronă (adică coada poli(A) a diferitelor transcrieri este degradată la viteze diferite), rezultând ARNm fără coada poli(A). ARNm care conţin astfel de elemente includ ARNm al citokinelor GM-CSF, interleukina 2 , factorul de necroză tumorală a (TNF-a), interferonul -a . O caracteristică structurală a ARE din a doua clasă este prezența repetărilor pentanucleotidelor în tandemAUUUA , iar regiunea bogată în AU este situată înaintea acestor repetări. ARE de clasa III lipsește o pentanucleotidă AUUUAși au doar o regiune bogată în U. Un astfel de element există, de exemplu, în ARNm care codifică c-Jun. Cinetica degradării ARNm în acest caz este similară cu cea a ARE I [3] .
Degradarea ARNm poate apărea și datorită activității endonucleazei , iar acest mecanism este dependent atât de deadenilare, cât și de decapsulare. Acest mecanism a fost găsit în ARNm care codifică receptorul transferinei . Degradarea acestor ARNm include scindarea endonucleazei a 3’-UTR, recunoașterea IRE fiind o etapă intermediară și reglare determinată de nivelurile intracelulare de fier [34] .
Codonii inițiatori din 5'-UTR și uORF pot juca, de asemenea, un rol într-un mecanism special de dezintegrare a ARNm mediată de nonsens (desintegrare a ARNm mediată de nonsens ) . Semnalul care declanșează această cale este un codon lipsit de sens, urmat de o conexiune între doi exoni formați în timpul splicing -ului - un complex de splicing exon , sau EJC ( în engleză Exon junction complex ) [35] (prezența unei astfel de conexiuni distinge un codon terminator prematur. din cel principal, deoarece codonul stop și 3'-UTR sunt situate după ultimul exon). Joncțiunile exonilor sunt recunoscute de proteinele marker care se atașează la transcriptul neprocesat în timp ce sunt încă în nucleu și rămân asociate cu acesta după procesarea ARNm și transferul în citoplasmă [36] . În cazul ARNm de tip sălbatic (adică „nedefectuos”), mașina de traducere îndepărtează proteina marker pentru a preveni degradarea transcriptului. Dacă ribozomul întâlnește un codon stop prematur sau dacă uORF sunt prezente în transcript, acesta se dezintegrează, iar mARN-ul defect marcat cu proteine marker este implicat în NMD [37] . În drojdia Saccharomyces cerevisiae (au un al doilea semnal care declanșează NMD - elemente exonice în aval ( DSE) ), ARNm care conțin uORF-uri active funcțional, de exemplu, care codifică GCN 4 și YAP 1 , nu se degradează de-a lungul căii NMD. uORF și secvența de codificare există secvențe de stabilizare specifice ARNm care împiedică activarea NMD datorită interacțiunii cu ubiquitin ligaza Pub1 de legare a ARN-ului [ 38] .
uORF-urile pot regla, de asemenea, stabilitatea ARNm independent de NMD. 5’-UTR al ARNm al genei YAP2 a S. cerevisiae conține 2 uORF, care suprimă scanarea transcriptului de către ribozom și promovează degradarea ARNm [26] . Efectul de destabilizare depinde de mediul codonului terminator, care reglează eficiența translației și stabilitatea ARNm.
Mai multe studii sugerează că multe ribonucleoproteine nucleare eterogene (hnRNPs) funcționează numai în nucleu, ci și controlează soarta ARNm în citoplasmă [39] , reglează translația, stabilitatea ARNm și localizarea acestuia în citoplasmă [37] . Un exemplu este proteina precursor de amiloid ( APP ) . O creștere a conținutului de APP este un factor important în dezvoltarea bolii Alzheimer . Stabilitatea ARNm APP depinde de un element de 29 de nucleotide foarte conservat situat în 3’-UTR și care interacționează cu diferite proteine citoplasmatice de legare a ARN [40] .
Controlul expresiei genelor la nivel post-transcripțional, realizat de regiuni netraduse, este deosebit de important în timpul dezvoltării. Aranjarea asimetrică a unor ARNm în celulă duce la o aranjare asimetrică a proteinelor codificate de acestea. Acesta este cel mai convenabil mecanism pentru localizarea proteinelor, deoarece un ARNm poate servi ca șablon pentru mai multe runde de traducere. În multe cazuri, ARNm-urile sunt localizate în complexe ribonucleoproteice împreună cu proteinele aparatului de traducere, garantând astfel eficiența necesară a traducerii [3] .
Există 3 mecanisme principale pentru aranjarea asimetrică a ARNm:
ARNm -ul proteinei de bază a mielinei ( MBP) este livrat proceselor oligodendrocitelor care formează teaca de mielină a axonilor SNC prin transport direcțional activ . La șoareci, ARNm este transportat și localizat prin secvențe semnal speciale situate în 3’-UTR: semnalul de transport ARN (lungime de 21 de nucleotide) și un element suplimentar, regiunea de localizare a ARN [41] .
Multe exemple de stabilizare locală a transcripției au fost găsite în stadiile incipiente ale dezvoltării Drosophila . Astfel, transcrierile care codifică proteina de legare a ARN Nanos și proteina de șoc termic Hsp83 sunt degradate peste tot, cu excepția citoplasmei de la polul posterior al embrionului . Diverse elemente de reglare cis localizate în 3’-UTR-urile ARNm-urilor respective sunt responsabile atât pentru degradarea acestor ARNm în întregul embrion, cât și pentru stabilizarea lor la capătul posterior al embrionului [42] .
Fenomenul de difuzie a ARNm determinat de mediu este bine demonstrat de ARNm al proteinei Bicoid din Drosophila. Elementele implicate în pasul cheie în acest proces, ancorarea transcripției, nu sunt complet descrise, dar una dintre proteinele implicate, Staufen , este o proteină de legare a ARNds necesară pentru a opri Bicoid la capătul anterior al embrionului [43]. ] .
În toate exemplele de mai sus, localizarea a fost reglată de elemente de reglare cis situate în 3'-UTR, dar astfel de elemente situate în 5'-UTR și chiar regiunea de codificare sunt de asemenea cunoscute. Astfel de elemente sunt cunoscute sub denumirea de coduri de arhivare ARNm ( ing. coduri zip ARNm ), ele interacționează cu proteinele de legare corespunzătoare ( ing. zip-code-binding proteins ), de exemplu, deja menționat Staufen. Codurile de arhivare nu au nicio asemănare în structura primară și secundară . Ele pot avea o structură secundară și terțiară complexă (complexă) , în care structura primară ( secvența de nucleotide ) nu este la fel de importantă ca structura spațială [44] , ci, dimpotrivă, pot fi secvențe de nucleotide scurte [45] , incluse uneori în elemente repetate ( de exemplu, în cazul transcrierii Vg1 în broasca Xenopus [46] ).
Splicing-ul alternativ este cel mai important mod de a genera diferite ARNm dintr-o transcriere originală, care codifică aceleași proteine sau diferite. În acest caz, pe lângă ARNm lungi care codifică proteine, se pot forma și ARN-uri necodificante. ARNm-ul scindat poate suferi un proces de recapitulare pentru a forma un ARNm cu o regiune 5' netradusă trunchiată sau care codifică doar un fragment al proteinei originale. În plus, se știe că fragmentele 3’-UTR formate în timpul splicing-ului alternativ pot începe să funcționeze ca ARN necodificatori trans-regulatori , independent de ARN-ul principal [47] .
Se știe că ARNm este capabil să se închidă într-o buclă (circularizare) datorită interacțiunii proteinelor specifice care se leagă la coada poli(A) , care promovează legarea factorului eIF4F de capac . Ca rezultat, ARNm capătă o formă închisă, inițierea traducerii este stimulată și eficiența traducerii este crescută. Cu toate acestea, în unele cazuri, 5’-UTR și 3’-UTR ale aceluiași ARNm se pot lega complementar unul cu celălalt. Astfel, ARNm al genei umane care codifică factorul de transcripție p53 are regiuni în 5’-UTR și 3’-UTR care sunt complementare între ele. Prin legarea unul de celălalt și de factorul translațional RPL26 , ei cresc astfel eficiența translației, care este unul dintre motivele acumulării rapide a proteinei p53 ca răspuns la deteriorarea ADN -ului [48] .
Analiza mARN-urilor diferitelor gene umane a arătat că 5’-UTR conține motivul care interacționează în mod specific cu capetele 3’ ale miARN-urilor, în timp ce multe dintre aceste ARNm au un situs complementar 3’-UTR la capătul 5’. . Studii suplimentare au arătat că legarea 5’-UTR la miARN facilitează legarea capătului 5’ al ARNm la capătul 3’, iar ARNm a căror activitate este puternic determinată de miARN au situsuri de legare previzibile pe ambele UTR. Astfel de ARNm se numesc miBridge. S-a constatat, în plus, că pierderea acestor situsuri de legare a redus reprimarea transcriptului determinată de miARN. Astfel, s-a descoperit că situsurile de legare ale NTO între ele sunt necesare pentru suprimarea traducerii ARNm. Acest lucru indică faptul că interacțiunea complementară a 5’-UTR și 3’-UTR este necesară pentru reglarea precisă a expresiei genelor [49] .
ARNm bacterian conține, de asemenea, regiuni 5’- și 3’-netraduse [51] [52] . Lungimea 5’-UTR a bacteriilor este mult mai mică decât cea a eucariotelor și este de obicei de 3-10 nucleotide. De exemplu, lungimea transcriptului 5’-UTR a operonului de lactoză Escherichia coli este de numai 7 nucleotide [53] . În 5’-UTR al bacteriilor, este localizată secvența Shine-Dalgarno ( AGGAGG) [54] , care servește la legarea ribozomului și este separată printr-un distanțier de codonul de start AUG. Deși 5’-UTR-urile bacteriilor și eucariotelor sunt diferite, s-a demonstrat că adăugarea de nucleotide CC la distanțierul ARNm al genei Ner a bacteriofagului Mu , care este bine exprimată în celulele Escherichia coli și Streptomyces , a condus la exprimarea cu succes a această genă în celulele reticulocitelor de iepure [55] .
Elementele structurii secundare localizate în 5’-UTR au, de regulă, un efect supresor asupra translației [56] . În special, în 5’-UTR se află de obicei atenuatoarele - elemente ale operonilor care provoacă terminarea prematură a translației [57] (cel mai faimos exemplu de atenuare este expresia operonului triptofan ).
În plus, 5’-UTR al bacteriilor găzduiește majoritatea riboswitch -urilor [58] — elemente de reglare a ARNm capabile să se lege de molecule mici , ceea ce duce la o modificare a eficienței formării proteinelor codificate de acest ARNm [59] .
Spre deosebire de eucariote, 3'-UTR lungi sunt rare la bacterii și prost înțelese. Cu toate acestea, unele bacterii, în special Salmonella enterica , sunt cunoscute că au mARN-uri asemănătoare eucariotelor cu 3'-UTR lungi (în S. enterica , acesta este ARNm hilD ). Se presupune că hilD 3'-UTR îndeplinesc diferite funcții, în special, afectează turnover-ul ARNm-urilor lor, deoarece ștergerea acestor regiuni a determinat o creștere a cantității de ARNm corespunzătoare [60] .
Regiunile netraduse există și în ARNm al multor arhee . În special, în 5’- și 3’-UTR-urile ARNm ale arheei metanogenice Methanocaldococcus jannaschii (ca și în alți membri ai ordinelor Methanopyrales și Methanococcales ), elementul SECIS este localizat , care este responsabil pentru inserție. aminoacidului selenocisteină în lanțul polipeptidic [61 ] .
S-a stabilit că ARNm al majorității haloarheilor , precum și Pyrobaculum și Sulfolobus , nu au un 5’-UTR pronunțat, dar ARNm al arhea-methanogens are 5’-UTR lung. În acest sens, se presupune că mecanismul de inițiere a translației în arheile metanogene poate fi diferit de cel al altor reprezentanți ai acestui domeniu [56] . Cu toate acestea, ARNm haloarheal conține 3'-UTR-uri și capetele lor 3' nu suferă modificări post-transcripționale. În mod surprinzător, acelor transcrieri haloarheale care au un 5'-UTR le lipsește secvența Shine-Dalgarno. Lungimea 3'-UTR a haloarheilor a variat de la 20 la 80 de nucleotide; nu au fost identificate motive și secvențe structurale conservate, cu excepția penta-U-nucleotidei din regiunea de terminare a translației [62] .
Pentru ARNm arheean, au fost descrise riboswitches , inclusiv TPP-riboswitches (se leagă de tiamină pirofosfat (TPP)), care sunt localizate în 5’-UTR (riboswitches similare se găsesc și în bacterii și eucariote) [63] .
În mulți viruși , inițierea translației are loc printr-un mecanism independent de capac și se realizează prin elementele IRES deja menționate localizate în 5’-UTR [64] . De exemplu, acest lucru se întâmplă în virusurile HIV , hepatitei A și C [65] . Acest mecanism de inițiere a translației este convenabil deoarece în cazul lui nu este necesară asamblarea complexului proteic pre-inițiator, iar virusul se poate multiplica rapid [53] .
Virușii au, de asemenea, un alt mecanism de inițiere a traducerii, independent de capac, care nu este asociat cu IRES. Acest mecanism este prezent în multe virusuri ale plantelor . În acest caz, există un element special de traducere independent de cap (CITE) situat în 3'-UTR. Adesea, CITE leagă factori de translație, de exemplu, complexul eIF4F, și apoi interacționează complementar cu capătul 5’, furnizând factori de inițiere a translației la locul de început [66] .
La virusurile al căror genom este reprezentat de o moleculă de ARN monocatenar cu polaritate pozitivă , 3’-UTR nu numai că afectează translația, ci este și implicat în replicare : de la aceasta începe replicarea genomului viral [67]. ] .
Virusul rujeolei (genul Morbillivirus din familia Paramyxoviridae ) are un genom reprezentat de o moleculă de ARN monocatenar cu polaritate negativă. A fost stabilit un mecanism interesant pentru genele sale M și F. ARNm-urile acestor gene au UTR lungi; ele reprezintă ~ 6,4% din ARNm total. Deși aceste gene nu sunt direct implicate în replicare, ARNm 3'-UTR al genei M crește rata de acumulare a proteinei M și astfel declanșează replicarea genomului. În același timp, 5’-UTR al ARNm al genei F reduce formarea proteinei F și astfel suprimă replicarea [68] .
Deoarece regiunile netraduse joacă un rol critic în reglarea expresiei genelor , diferite modificări care afectează aceste regiuni conduc adesea la afecțiuni precum trombocitemia ereditară , cancerul de sân , sindromul X fragil , tulburarea afectivă bipolară , boala Alzheimer și altele [69] . Diagramele de mai jos arată asocieri între mutațiile care afectează unul sau altul element funcțional al 3’-UTR și 5’-UTR și diferite boli.