Secvențierea de generație următoare (NGS ) este un grup de metode pentru determinarea secvenței de nucleotide a ADN și ARN pentru a obține o descriere formală a structurii sale primare . Tehnologia metodelor de secvențiere de nouă generație vă permite să „citiți” mai multe secțiuni ale genomului simultan , care este principala diferență față de metodele de secvențiere anterioare. NGS se realizează prin cicluri repetate de extensie a lanțului indusă de polimerază sau ligarea multiplă a oligonucleotidelor . În timpul NGS, până la sute de megabaze și gigabaze de secvențe de nucleotide pot fi generate într-un singur ciclu de lucru [1] .
Primul concept de secvențiere a fost propus de Senger în 1977 [2] . Tehnologia se numește „metoda de rupere a lanțului” . În același an, Maxam și Gilbert au propus o metodă alternativă, numită „ metoda de degradare chimică ” – se bazează pe scindarea unui fragment de ADN marcat la un capăt sub acțiunea unor reactivi specifici. Determinarea secvenței de nucleotide este efectuată prin electroforeză pe gel de poliacrilamidă urmată de autoradiografie . Nevoia de secvențiere în masă, de înaltă calitate și rapidă a stimulat numeroase modificări și tot felul de îmbunătățiri ale acestor metode. În grade diferite, aproape toate componentele acestui proces au suferit modificări. Punctul de cotitură în dezvoltarea tehnologiei a fost apariția PCR (mijlocul anilor 1980) și automatizarea principalelor etape ale „citirii” ADN-ului, care au dat naștere metodelor de secvențiere de ultimă generație. Platformele pentru metodele de generație următoare se bazează pe paralelizarea procesului de „citire” ADN-ului și, astfel, într-o singură rulare a secvențatorului, este posibil să se determine structurile primare ale mai multor secțiuni ale genomului. Sequencerele de nouă generație au devenit mult mai ieftine și mult mai eficiente decât predecesorii lor. Până în prezent, performanța unor secvențiere este deja măsurată în sute de miliarde de perechi de baze , ceea ce, de exemplu, permite unor astfel de dispozitive să scaneze un genom uman individual în doar câteva zile [3] .
Mai jos sunt metodele NGS în ordine cronologică. Primele metode, de exemplu, bazate pe pirosecvențiere, au dat naștere dezvoltării NGS, dar practic nu sunt utilizate în acest moment. Restul metodelor discutate mai jos sunt utilizate pe scară largă în acest moment, fiecare metodă având propriile avantaje și specificul de aplicare [4] [5] [6] .
metodă | principiu | lungime maximă de citire, perechi de baze | costul secvențierii 1 Mbp | costul secvențatorului | durata ciclului | numărul de citiri pe ciclu | Beneficii | limitări |
---|---|---|---|---|---|---|---|---|
454 Științele vieții | pirosecvențierea și luciferaza | 1000 | 10 USD | 500.000 USD | ora 7 | 1.000.000 | lungimea regiunilor genomice citite; viteză | Preț; eroare |
Illumina SOLEXA | nucleotide cu fluorofor și terminatori amovibili | 300 | 0,05-0,15 USD | 1.000.000 USD -(NovaSeq 6000)
100.000 USD -(MiSeq) |
4 ore - 55 ore | până la 5.000.000.000 | eficienta, costul | viteză |
Solid | legarea sondelor oligonucleotidice cu un fluorofor | 75 | 0,13 USD | 595.000 USD | până la 10 zile | până la 2 400 000 000 | Preț | viteză |
Helicos | nucleotide cu fluorofor și terminatori amovibili | 2900 | 2 dolari | 1.350.000 USD | 1 oră | 35.000—75.000 | lungimea regiunilor genomice citite; viteză | productivitate scăzută cu eroarea mică dorită; Preț |
IonTorrent | modificarea pH-ului în timpul adăugării de nucleotide | 600 | $1 | 100.000 USD | 3 ore | până la 5 000 000 | Preț; viteză | eroare |
Pac Bio Sequel [9] | nucleotide cu fluorofor | 20 000 | 2 dolari | 600.000 USD | 20-30 ore | Până la 500.000 | lungimea citirii, precizia | cantitate de material, pret |
Minion Mk1B [10] [11] | schimbarea intensității curentului pe măsură ce circuitul trece prin nanopor | lungimea întregului NK, până la 2.000.000 | 0,47-0,90 USD | 1000 USD | 1 min - 2 zile | — | lungimea citirii, costul, lipsa de amplificare și transformări chimice complexe | eroare |
Datorită dezvoltării rapide a metodelor de secvențiere, parametrii metodelor, cum ar fi costul secvențelor și munca lor, timpul și lungimea secțiunilor citite se pot modifica [5] .
Secvențierea semnăturii masive paralele (MPSS ) este una dintre primele tehnologii NGS care a fost dezvoltată în anii 1990 de Lynx Therapeutics pentru secvențierea transcripției ARNm și evaluarea expresiei genelor pe baza nivelurilor individuale de ARNm dintr-o singură celulă [12] . În metoda MPSS, transcrierile sunt capturate pe microbile individuale cu un șablon ADN; ARNm-urile sunt citite prin hibridizare cu o etichetă fluorescentă și apoi îndepărtate și așa mai departe de mai multe ori la rând. Rezultatul sunt secvențe cu lungime de la 17 la 20 de perechi de baze (bp). Numărul de transcrieri care indică nivelul de exprimare este determinat de numărul de transcrieri per milion de molecule. Această metodă nu necesită identificarea genelor înainte de începerea analizei, iar sensibilitatea sa este de câteva molecule de ARNm per celulă [13] .
Prima platformă NGS eficientă din punct de vedere comercial. 454 Life Sciences a fost fondată în 2000 de Jonathan Rothberg (lansat în 2005). Această tehnologie este o sinteză secvenţială a metodelor de PCR în emulsie şi de pirosecvenţiere [14] .
Amplificarea ADN-ului are loc în picături de apă într-o emulsie uleioasă. Fiecare picătură de apă conține un șablon ADN monocatenar legat de un primer pe o sferă. Apoi, fiecare mărgele este plasată pe un cip, care este o fibră optică . Acolo sunt plasate și enzimele necesare secvențierii: ADN polimeraza, luciferaza , ATP-sulfurilază . În ultimul ansamblu, reacția de secvențiere are loc în celule cu un volum de 3,4·10 6 pl, pe pereții cărora există un înveliș metalic special care nivelează zgomotul [15] .
Autorii metodei sunt chimiștii britanici Shankar Balasubramanian și David Klenerman. Această metodă de secvențiere utilizează molecule de ADN unice atașate la microsfere. În 2006, a fost lansat Solexa Genome Analyzer 1G, prima platformă care generează segmente scurte de genom. De când a fost achiziționat de Illumina, Genome Analyzer utilizează celule optic clare cu 8 suprafețe individuale (uneori mai puține: 4, 2 sau chiar 1) unde se leagă oligonucleotidele . Spre deosebire de pirosecvențierea, alungirea secvenței are loc treptat, ceea ce face posibilă îndepărtarea cipurilor ADN mari la un moment dat folosind o cameră [16] .
Platforma SOLiD (Supported Oligonucleotide Ligation and Detection System 2.0) dezvoltată de Applied Biosystems este o tehnologie de secvențiere de citire scurtă bazată pe ligatură . Metoda a fost propusă în laboratorul George Church și publicată în 2005. Esența metodei este determinarea secvenței de nucleotide a fragmentelor mici (25-75 bp) de ADN genomic; adaptorii sunt legați la ambele capete ale ADN-ului pre-fragmentat , care sunt necesare pentru PCR în emulsie pe granule magnetice și secvențierea ulterioară pe o celulă de flux [17] .
Tehnologia NGS fără separare electroforetică , permițând citirea a milioane de secvențe scurte de ADN imobilizate . Ideea principală a metodei este generarea unui număr mare de „poloni” unice (colonii moleculare generate de polimerază), care sunt secvențiate într-o ordine aleatorie. Secvențierea poloniei este efectuată pentru o bibliotecă de etichete de capăt perechi (etichete de capăt perechi): fiecare moleculă de ADN are o lungime de 135 de perechi de baze (bp), conține două etichete lungi de 17-18 bp, separate și flancate de o secvență comună . 18 ] [19] .
Prima metodă de secvențiere cu o singură moleculă dezvoltată de HeliScope (Helicos BioSciences) are un debit de aproximativ 1 Gb/zi. Principiul de funcționare: după amplificarea clonală a probei are loc fragmentarea ADN-ului, urmată de poliadenilare la capătul 3’, urmată de secvențiere alternată cu spălarea probelor cu nucleotide marcate fluorescent [20] . În 2012, compania a fost declarată falimentară și a încetat să mai existe [21] , dar firma SeqLL, înființată în 2013, a primit licență pentru tehnologie [22] .
În această metodă, 4 adaptori sunt introduși secvențial în fragmentul de ADN care urmează să fie secvențial, datorită căruia, în timpul replicării ulterioare a Phi29 de către ADN polimerază ( replicarea cercului rulant ), molecula de ADN sintetizată este pliată în nanobbile de ADN. Apoi, nanobaloanele sunt depuse pe un substrat care are numeroase câmpuri de ~300 nm pentru legarea ADN-ului, dispuse într-o rețea. Organizarea acestor câmpuri face posibilă potrivirea mai multor ADN pe substrat și creșterea densității informațiilor din imagine în comparație cu aplicarea aleatorie a ADN-ului pe substrat (de exemplu, ca în secvențierea polonică) [23] .
Ligarea ancoră a sondei combinatorie este o metodă de secvențiere combinată care utilizează o combinație de hibridizare și ligatură a grupului de sonde. Fiecare sondă constă din nouă baze care sunt degenerate (adică pot fi oricare dintre cele patru) în toate pozițiile, cu excepția uneia, care urmează să fie citite. Poziția de interes este marcată cu unul dintre cei patru coloranți corespunzători fiecărei baze azotate. O secvență de ancorare complementară adaptorului și sondelor este hibridizată pe șablon. Sondele hibridizate opus unuia dintre capetele secvenței de ancorare sunt apoi legate. După hibridizare și ligatură, sondele în exces sunt spălate și se face o imagine. Apoi întregul complex ancoră-sondă este spălat și procesul se repetă folosind sonde pentru alte poziții. După citirea a 5 baze adiacente, procesul se repetă folosind ancore cu cinci baze degenerate suplimentare, permițând secvențierea a până la 10 baze pe fiecare parte a adaptorului. Un total de 70 de citiri de baze din fragmentul original sunt secvențiate, 35 de baze la fiecare capăt al adaptorului. Din cauza distanței dintre adaptoare, aceste 35 de secvențe de baze nu sunt învecinate deoarece conțin un spațiu de două baze și un decalaj de cinci baze [24] .
Metoda se bazează pe relația dintre informațiile chimice și cele digitale; această tehnologie se mai numește secvențiere indusă de pH . Procesul se bazează pe detectarea protonilor, care sunt obținuți în timpul sintezei unui lanț de ADN ca produs secundar. În consecință, pH-ul soluției se modifică, ceea ce poate fi detectat [25] .
Platforma Ion Torrent diferă de alte tehnologii de secvențiere prin faptul că nu utilizează nucleotide modificate sau tehnici optice. Metoda Ion Torrent vă permite să studiați transcriptomurile , ARN-urile mici și să efectuați ChIP-seq . Mai mult, poate fi folosit pentru a studia genomurile comunităților microbiene [25] .
Apariția metodei de secvențiere în timp real a unei molecule unice (SMRT) a făcut posibilă observarea activității ADN polimerazei, care formează lanțul sintetizat, în timp real. Esența metodei este de a determina secvența de nucleotide a fragmentelor de ADN genomic cu adaptori ADN specifici legați la capete, care sunt necesari pentru secvențierea ulterioară. Semnificația secvențierii SMRT este similară cu metodele NGS descrise anterior - ADN polimeraza completează a doua catenă a moleculei de ADN studiată folosind nucleotide marcate cu diferite etichete fluorescente, care sunt înregistrate cu ajutorul microscopiei confocale de înaltă rezoluție [26] .
Metoda se bazează pe măsurarea curentului ionilor printr-un singur nanopor într-o membrană neconductoare . Pe măsură ce nucleotidele trec prin acest por, curentul scade. Timpul pentru care curentul ionic se modifică și magnitudinea acestei căderi depind de ce nucleotidă se află în prezent în interiorul porului [27] .
Viteza și costul scăzut al metodelor NGS, indisponibile anterior, au provocat un boom în industria cercetării genomice. Datorită NGS, a devenit posibilă efectuarea de experimente anterior inaccesibile din punct de vedere tehnic [28] [29] . Aplicarea NGS nu se limitează la determinarea secvențelor genomice, ci se extinde la studiul transcriptomului, structurii cromatinei și al altor domenii ale biologiei moleculare și celulare. Mai jos sunt principalele exemple de domenii de aplicare a metodelor NGS [30] .
Reducerea și răspândirea NGS au făcut posibilă determinarea site-urilor de legare proteină-ADN ( ChIP-seq ), a regiunilor ADN care interacționează ( determinarea conformației cromozomului ) și a regiunilor deschise de cromatină în întregul genom, precum și implementarea proiectelor ENCODE și modENCODE [31] .
ChiP-seq este utilizat pentru a mapa site-urile de legare ale proteinelor de legare a ADN-ului, care a fost realizat anterior prin imunoprecipitarea cromatinei și hibridizare fără secvențiere cu microarray [32] .
Au devenit disponibile genomul sistemelor vii de complexitate diferită, de la microorganisme la oameni, inclusiv genomul celulelor de leucemie mieloidă normală din punct de vedere citogenetic . Creșterea lungimii citirilor a accelerat asamblarea genomilor întregi [33] .
Secvențierea anumitor regiuni din genom este utilizată pentru a identifica polimorfisme (în special polimorfisme cu un singur nucleotide ) și mutații ale genelor implicate în dezvoltarea tumorilor și a altor boli. Un exemplu al unei astfel de lucrări la scară largă este proiectul 1000 de genomi [34] .
NGS este utilizat pe scară largă în studiile diversității microorganismelor din diverse probe (de exemplu, populațiile microbiene din ocean și sol, identificarea de noi virusuri în organele transplantabile, caracterizarea microflorei caracteristice tractului gastrointestinal etc.) [35] .
Pe baza NGS, a fost dezvoltată o nouă abordare de secvențiere a ARN (ARN-seq) pentru cartografierea și enumerarea transcriptelor din probele biologice. Această metodă are avantaje față de metoda microarray ADN utilizată anterior . De exemplu, matricele ADN depind de suprapunerea secvențelor genomice, în timp ce ARN-seq permite caracterizarea transcripției fără cunoașterea prealabilă a site-ului de început al transcripției [36] .
În viitorul apropiat, tehnologiile de secvențiere vor deveni mai rapide și mai puțin costisitoare, permițându-le să fie utilizate pentru a identifica ținte pentru terapia medicamentoasă la pacienții cu cancer. Încă din 2013, analiza de secvențiere de generație următoare a durat mai puțin de 100 de zile de la biopsie până la finalizarea NGS. Secvențierea întregului genom (WGS) și secvențierea întregului transcriptom (WTS) necesită aceeași perioadă de timp [37] .