ARNr 16S este unul dintre cele trei tipuri principale de ARNr care formează coloana vertebrală a ribozomilor procarioți . Numerele din numele ARNr sunt egale cu valoarea constantei de sedimentare . În consecință, pentru o moleculă dată, această valoare este egală cu 16S ( unități Swedberg ). În total, trei tipuri de ARNr au fost găsite în microorganismele procariote: 23S și 5S în subunitatea mare a ribozomului (50S), 16S în subunitatea mică a ribozomului (30S). În mod similar, constantele celorlalte două molecule de ARNr sunt 23 și, respectiv, 5 S. Analogul eucariot al ARNr 16S este ARNr 18S [1] .
Până în prezent, secvențele de nucleotide din ARNr 16S și ARNr 18S au fost studiate pentru mai mult de 400 de specii din diferite regate ale vieții sălbatice . Secvența genei ARNr 16S este utilizată în principal în studiul filogeneticii bacteriilor și arheilor . Din 2010, a fost lansat proiectul Earth Microbiome , care reunește cercetări pe această temă. De asemenea, secvența genei ARNr 16S este utilizată pentru cercetarea medicală asupra bacteriilor patogene.
ARNr -ul 16S a fost izolat pentru prima dată de Eisenberg și Litaur în 1959, în timpul experimentelor de izolare și studiere a proprietăților fizice ale ARN -ului Escherichia coli . Pe baza unei comparații a vâscozităților soluțiilor de ARN și ADN , ei au sugerat că ARN-ul este o moleculă monocatenar. La separarea moleculelor de ARN izolate din celulele bacteriene , s-au găsit două fracții de ARN care diferă în valorile coeficienților de sedimentare. Pentru fracția mai ușoară, coeficientul a fost egal cu 16S, iar pentru fracția mai grea, 25S [2] .
Mai târziu, în anii 1960, A. Belozersky și A. Spirin au descoperit că ARNr reprezintă 80-90% din tot ARN-ul celular. De asemenea, au descris pentru prima dată diferența în structura și compoziția ARNr în organismele procariote și eucariote. Descoperirea ribozomilor și ARNr de tip procariot în mitocondrii și cloroplaste a devenit una dintre dovezile teoriei simbiogenezei [3] [4] [5] .
Structura primară a ARNr 16S este reprezentată de o secvență monocatenară constând din 1600 de ribonucleotide . De-a lungul secvenței, conservate pentru multe specii și regiunile hipervariabile sunt distribuite uniform. Regiunile sunt numite conservatoare, ale căror secvențe diferă ușor sau nu diferă deloc în organismele luate în considerare. Hipervariabile sunt acele regiuni ale căror secvențe diferă mult în organisme îndepărtate, dar în cele strâns înrudite au un anumit procent de similitudine [6] [7] .
Gena ARNr 16S conține nouă regiuni hipervariabile, denumite V1-V9. Fiecare regiune are 30 până la 100 de perechi de baze în lungime. Aceste situsuri sunt implicate în formarea structurii secundare a subunității mici a ribozomului . Între regiunile hipervariabile, gena ARNr 16S conține secvențe foarte conservate. Gradul de conservatorism al regiunilor hipervariabile nu este același - s-a demonstrat că secvențele regiunilor mai conservate sunt similare la organisme la nivelul taxonilor de rang înalt, și mai puțin conservatoare - la nivelul rangurilor taxonomice scăzute precum genurile și specii [8] [9] .
În structura secundară a ARNr -ului 16S se pot distinge 4 domenii bine definite (precum domeniul proteic , domeniul ARN este o structură stabilă, auto-asamblabilă a moleculei): domeniul 5' (reziduurile 1-556), central (reziduuri 564-912) și două capete ′ (domeniul mare 926-1391 și domeniul mic 1392-1542). Diferitele domenii sunt separate unele de altele prin elice care se termină cu ace de păr ARN . De asemenea, structura secundară a ARNr 16S conține baze nepereche 5’ și 3’ care formează bucle. Se presupune că aceste baze pot participa la formarea structurii terțiare a ARNr 16S, conectându-se prin legături de hidrogen , nu conform legării canonice de bază Watson-Crick [11] .
Următoarele funcții au fost descrise pentru ARNr 16S:
Toate cele trei gene ARNr procariote (16S, 23S și 5S ) sunt într-un operon co-transcris și sunt separate de gene de ARNt și secvențe distanțiere . În timpul procesării transcriptului primar , efectuată de endonucleaze , secvențele distanțiere sunt îndepărtate și intermediarii apar ca un produs și, în final, ARN-ul matur [13] .
ARNr-ul 16S este o componentă a subunității mici a ribozomului și joacă un rol important în decodificarea ARNm . Precursorul ARNr este ARNr 17S, care este eliberat din transcriptul primar de către nucleaza RNaza III . Procesarea ulterioară a capătului 5’ este efectuată de RNazele E și G. Cum este procesat capătul 3’ rămâne neclar în prezent [13] .
Secvența de ARNr 16S este reprezentată de nouă regiuni hipervariabile și secvențe conservate care le separă. Datorită acestor caracteristici ale structurii primare, s-a propus utilizarea genei ARNr 16S pentru studii filogenetice . Primul om de știință care a folosit ARNr 16S pentru a stabili relații de familie între grupuri de bacterii a fost Carl Woese . El a sugerat că gena ARNr 16S ar putea fi folosită ca un ceas molecular de încredere , deoarece s-a descoperit că ARNr-ul 16S de la specii bacteriene îndepărtate evolutiv au părți similare ale secvenței și funcției [14] [1] [15] .
Astfel, regiunile hipervariabile fac posibilă distingerea diferitelor specii între ele, iar prezența unor regiuni extrem de conservate permite crearea de primeri universali care pot fi utilizați pentru a studia bacteriile și arheile , indiferent de apartenența lor taxonomică . Prima pereche de primeri universali care a devenit utilizat pe scară largă a fost dezvoltată de Weisburg et al. [14]
De asemenea, trebuie remarcat faptul că regiunea de recoacere a primerului selectată este atât de conservatoare încât primerii universali pot fi utilizați pentru a amplifica ARNr- ul 16S al mitocondriilor și cloroplastelor , descendenți ai alfa-proteobacteriilor și , respectiv , cianobacteriilor [16] .
Metodele de secvențiere cu primeri universali sunt utilizate în microbiologia medicală ca o alternativă rapidă și ieftină la metoda morfologică de identificare a bacteriilor, care necesită un număr mare de manipulări, inclusiv adesea necesitatea cultivării unui potențial patogen în condiții de laborator pentru o perioadă lungă de timp. În plus, secvențierea oferă rezultate mai fiabile [17] . În această industrie, sunt utilizate anumite regiuni hipervariabile: de exemplu, regiunea V3 este cea mai bună pentru identificarea genurilor de patogeni și V6 pentru identificarea speciilor [18] .
În 2010, a fost lansat proiectul Earth Microbiome , care și-a propus ambițioasa sarcină de a crea un catalog global al biodiversității microorganismelor necultivate de pe planeta noastră, adică a celor greu de cultivat și întreținut în laborator. . Acest studiu pe scară largă intenționează să analizeze comunitățile microbiene din peste 200.000 de mostre de mediu furnizate de laboratoare din întreaga lume. Secvențele genelor ARNr 16S sunt utilizate pentru a determina afilierea taxonomică a microorganismelor din probe. ADN-ul este izolat din probele colectate și apoi se efectuează PCR cu primeri pentru ARNr 16S. Ampliconii obținuți în timpul PCR sunt secvențiați . În acest tip de cercetare, se pot folosi tehnologiile de secvențiere Illumina , Ion Torrent și pot fi folosite și alte platforme . De regulă, secvențe complete de regiuni hipervariabile de interes pot fi obținute după un singur eveniment de secvențiere [19] . Proiectul a analizat până acum peste 30.000 de mostre [20] .
În astfel de studii, se acordă o atenție deosebită alegerii primerilor și fragmentului de amplificat . Principalele criterii sunt acoperirea completă a organismelor studiate (în acest caz, arhee și bacterii) și rezoluția filogenetică a secvenței, adică cât de detaliat este posibil să se determine apartenența taxonomică a unui organism din secvență [21] .
Proiectul Earth Microbiome folosește regiuni hipervariabile V4 și V4-V5 pentru a clasifica microorganismele, deoarece aceste regiuni sunt considerate optime pentru clasificarea comunităților microbiene. Primerii PCR pentru aceste fragmente reprezintă o îmbunătățire față de primerii 515F, 907R și 806R utilizați anterior. Îmbunătățirea versiunii vechi a primerilor a fost necesară pentru a putea obține ampliconi mai lungi, ceea ce a făcut posibilă identificarea mai bună a organismelor din grupele Crenarachaeota/Thaumarchaeota, a căror clasificare exactă nu a putut fi determinată anterior [22] [23] .
Zona de amplificat | Nume de amorsare | Secvența primerului (5’-3’) |
---|---|---|
V4 | 515F | GTG YCA GCM GCC GCG GTA A |
V4 [24] | 806R | GGA CTA CHV GGG TWT CTA AT |
V4-V5 | 515F | GTG YCA GCM GCC GCG GTA A |
V4-V5 | 926R | CCG YCA ATT YMT TTR AGT TT |
V4-V5 [23] | 907R | CCG TCA ATT CCT TTG AGT TT |
Odată cu acumularea unei cantități mari de date, s-a constatat că unele tipuri de bacterii au fost clasificate incorect în funcție de caracteristicile morfologice. Pe baza secvențierii ARNr 16S , au fost izolate specii noi, inclusiv cele care nu au putut fi cultivate în laborator [25] [26] și chiar genuri [27] . Odată cu apariția secvențierii de a treia generație, în multe laboratoare a devenit posibilă identificarea simultană a mii de secvențe de ARNr 16S în câteva ore, ceea ce permite studii metagenomice , cum ar fi studiile microflorei intestinale [28] .
Alături de numeroasele avantaje pe care le are metoda descrisă de stabilire a legăturilor de familie între grupuri de organisme (universalitate de utilizare și viteză relativă de execuție), există și dezavantaje. În special, regiunile hipervariabile fac puțin pentru a discrimina speciile strâns înrudite . De exemplu, secvențele genei ARNr 16S la reprezentanții familiilor Enterobacteriaceae , Clostridiaceae și Peptostreptococcaceae sunt similare în proporție de 99%. Adică, regiunea hipervariabilă a V4 poate diferi doar prin câteva nucleotide , ceea ce face imposibilă distingerea în mod fiabil între taxonii bacteriilor de rang scăzut . Dacă studiul taxonomiei bacteriene se limitează la analiza regiunilor hipervariabile ale ARNr 16S, se pot combina în mod eronat grupuri strâns înrudite într-un singur taxon și subestima diversitatea grupului de bacterii studiat [29] [30] .
Mai mult, genomul bacterian poate conține mai multe gene ARNr 16S ale căror regiuni hipervariabile V1, V2 și V6 reprezintă cea mai mare diversitate intraspecifică. Deși nu este cea mai precisă metodă de clasificare a speciilor bacteriene, analiza regiunilor hipervariabile rămâne una dintre cele mai utilizate metode aplicabile studiului comunităților bacteriene [31] .
Având în vedere presupunerea că evoluția este determinată de transferul vertical de material genetic de la strămoși la descendenți, genele ARNr 16S au fost mult timp considerate markeri specifici pentru specie și, prin urmare, foarte precisi pentru a determina relația dintre grupurile de procariote . Cu toate acestea, un număr tot mai mare de observații sugerează posibilitatea transferului orizontal al acestor gene. Pe lângă observațiile privind transferul orizontal de gene în natură, au fost prezentate dovezi experimentale pentru aceste evenimente. Studiul a folosit o tulpină mutantă de Escherichia coli , lipsită de propria sa genă ARNr 16S. Cu toate acestea, asamblarea unui ribozom funcțional a fost observată folosind ARNr 16S împrumutat de la o bacterie E. coli neînrudită [32] [15] . Interoperabilitate similară a fost observată și la Thermus thermophilus . Mai mult, atât transferul complet cât și parțial de gene a fost observat la T. thermophilus . Transferul parțial a fost exprimat în formarea spontană a unei secvențe himerice aparent aleatoare între gena bacteriei gazdă și gena străină [33] .
Deci, gena ARNr 16S ar fi putut evolua în mai multe moduri, inclusiv transferul de gene pe verticală și orizontală. Frecvența acestei din urmă variante poate fi semnificativ mai mare decât se credea anterior.
Secvențele complete ale genelor ARNr 16S, ca multe altele, sunt asamblate din citiri - anumite secvențe de nucleotide obținute după secvențiere . Secvențierea se realizează pe platforma Illumina (lungimea de citire ajunge la 250 de perechi de baze); folosind tehnologia de secvențiere Sanger (lungimea citirilor - până la 1000 de perechi de baze); folosind secvențierea semiconductoare ionice (lungimea citirilor - până la 200 de perechi de baze). Apoi, citirile sunt comparate cu secvența de referință a genei ARNr 16S, astfel secvența completă a genei este asamblată din multe citiri.
Secvențele genei ARNr 16S au fost determinate pentru tulpini de tip de bacterii și arhee și colectate în baze de date deschise, cum ar fi NCBI . Cu toate acestea, calitatea secvențelor secvențiale conținute în astfel de baze de date nu este adesea verificată. Ca rezultat, bazele de date secundare care conțin doar secvențe de gene 16S rARN sunt utilizate pe scară largă [34] . Cele mai frecvent utilizate baze de date sunt enumerate mai jos.
Baza de date EzBioCloud, cunoscută anterior ca EzTaxon, constă dintr-un sistem taxonomic ierarhic complet care conține 65.342 de secvențe de ARNr 16S bacteriene și arheale din februarie 2020. Baza de date EzBioCloud este organizată sistematic și actualizată în mod regulat. În plus, site-ul bazei de date oferă instrumente bioinformatice, cum ar fi calculatorul ANI, pentru a găsi similitudinea procentuală între două secvențe de genomi procariote, un instrument de aliniere perechi pentru două secvențe și multe altele [35] .
RDP este o bază de date organizată care oferă informații despre secvența ARNr și programe și servicii conexe. Conținutul sugerat include aliniamente ARNr grupate în filogeneză, arbori filogenetici derivați din aliniere , structuri secundare ARNr și diverse programe pentru vizualizarea și analiza informațiilor pentru cercetarea genelor ARNr. Majoritatea pachetelor software sunt disponibile pentru descărcare și utilizare locală [36] .
SILVA este o bază de date care conține un set verificat manual și actualizat în mod regulat de aliniamente ale secvenței ARNr subunități mici (16S/18S) și subunități mari de ribozom (23S/28S) legate de toate cele trei domenii de viață . De asemenea, pe baza bazei de date, a fost creat un serviciu pentru proiectarea primerului și construcția aliniamentelor filogenetice [37] .