Secvențierea la capătul pereche este una dintre metodele de secvențiere a ADN-ului de nouă generație bazată pe obținerea și secvențierea unei biblioteci de etichete de capăt perechi (PET ), în care regiunile scurte 5’- și 3’-terminale ale fragmentelor de ADN/cADN sunt conectate la fiecare. alta.cu un prieten.
Există două metode principale pentru a crea biblioteci de fragmente de capăt pereche: prin clonare și fără clonare [1] .
ADN-ul genomic suferă fragmentare (prin orice metodă: folosind endonucleaze de restricție, ultrasunete, nebulizare). Adaptorii care conțin situsuri de restricție pentru endonucleaze speciale, cum ar fi Mmel sau EcoP15I, sunt legați la fragmente de ADN . Fragmentele cu adaptoare sunt legate într-un vector bacterian . Celulele de E. coli sunt apoi transformate cu amestecul de ligatură. Plasmidele separate sunt purificate din coloniile bacteriene obținute, tratate cu una dintre endonucleazele speciale de restricție, ale căror situsuri sunt conținute în adaptoare. Aceste endonucleaze decupează partea centrală a fragmentelor de ADN donate, lăsând secțiunile de capăt. După legarea acestor secțiuni între ele, se formează fragmente de capăt pereche. Aceste fragmente de capăt pereche sunt scindate cu o endonuclează de restricție standard ale cărei situsuri sunt la marginile adaptoarelor donate. În funcție de alegerea tehnicii ulterioare de secvențiere, secvențele de fragmente de capăt pereche pot fi utilizate ca monomeri, dimeri sau concatemeri (mai multe fragmente unite împreună).
Fragmentul de ADN este metilat pentru a proteja împotriva acțiunii endonucleazelor de restricție . Capetele fragmentului sunt „tocite” și fosforilează capătul 5’. Aceste manipulări sunt necesare pentru a coase adaptoare (nemetilate) la capetele fragmentului de ADN. Acești adaptoare conțin un loc de restricție și pot fi, de asemenea, biotinilați. Fragmentele de ADN rezultate flancate de adaptori sunt circularizate. Dacă adaptoarele nu au fost biotinilate, se poate adăuga un adaptor „intern” biotinilat în timpul ciclizării. Biotina este utilizată pentru a izola fragmente de capăt pereche țintă pe un sorbent cu streptavidină. Molecula circulară de ADN este procesată de endonucleaza MmeI sau EcoP15I, ale căror situsuri de legare sunt conținute în adaptoare. Se formează PET gratuit. Înainte de secvențiere, adaptoarele sunt suturate la aceste fragmente de capăt pereche, care conțin secvențe pentru recoacere primerilor PCR . Reacția în lanț a polimerazei (PCR) este utilizată pentru amplificarea PET [2] .
Avantajul creării unei biblioteci prin clonare este păstrarea fragmentelor originale de ADNc de lungime completă. Cu toate acestea, clonarea este un proces lung și laborios. Cea mai populară metodă a câștigat metoda fără utilizarea clonării. Lungimea secvenţelor de etichetă ale fragmentelor de capăt pereche poate fi diferită. Etichetele mai lungi facilitează cartografierea citirilor . Endonucleazele utilizate pentru a crea fragmentele descrise mai sus (Mmel sau EcoP15I) dau etichete de 18/20 bp. şi 25/27 pb, respectiv [3] . Particularitatea acestor endonucleaze este că introduc o ruptură în lanțul ADN sub locul lor de legare. Fragmentele de capăt pereche rezultate sunt utilizate pentru secvențierea de generație următoare ( SOLID , Illumina, 454 Life Sciences). Etichetele mai lungi pot fi obținute prin alte metode de liniarizare ADN după etapa de ciclizare a fragmentului de ADN. Principalele avantaje ale secvențierii cu capete potrivite față de abordările cu etichetă unică (adică, etichetați doar un capăt al unui fragment de ADN) sunt costul redus, specificitatea crescută a cartografierii de citire și capacitatea de a determina caracteristicile structurale ale genomului.
Utilizarea fragmentelor de capăt pereche pentru secvențierea de novo a genomului are o serie de avantaje. Acest tip de secvențiere se numește secvențiere finală în perechi sau „secvențierea puștilor cu două țevi”. Cea mai populară abordare a fost propusă în 1995 [4] , ceea ce a reprezentat o îmbunătățire a strategiei de secvențiere descrisă în 1991 [5] .
Tehnologiile de secvențiere de ultimă generație fac posibilă citirea unei probe de ADN foarte rapid și economic, dar lungimea citirilor rezultate este mult mai scurtă în comparație cu cele obținute prin secvențiere folosind metoda Sanger . Asamblarea genomilor, în special la fel de complex ca genomurile eucariote , din fragmente scurte este o problemă complexă. Cu un număr mare de secvențe scurte, se pune întrebarea cum să le orientăm în direcția corectă și să le conectăm pentru a obține un genom complet. Prezența repetărilor în genom complică și mai mult această sarcină. Soluția la această problemă poate fi utilizarea fragmentelor de capăt pereche.
Variind lungimea fragmentului de ADN și, prin urmare, distanța dintre etichete, se poate alege o distanță care ar fi mai mare decât secțiunea care se repetă. Ca rezultat, cartografierea de citire devine lipsită de ambiguitate. Tehnologia de secvențiere cu sfârșit pereche permite utilizarea citirilor „ambigue” (adică cele care se mapează în mai multe locații din genom) pentru asamblarea genomului. Acest lucru crește eficiența, reducând în același timp costul secvențierii, deoarece aceste secvențe sau citiri ambigue sunt de obicei aruncate și nu sunt luate în considerare în timpul asamblarii.
Metoda de secvențiere a capetelor perechi ale ADN-ului face posibilă detectarea variațiilor structurale care au avut loc în genom: inserții, deleții , inversiuni și transpoziții. Când se creează o bibliotecă de fragmente de capăt pereche, sunt selectate fragmente de ADN de lungime egală, de exemplu, 3 kb. [6] . După finalizarea pașilor standard rămași (vezi mai sus), obținem biblioteca. Secvențăm și mapăm citirile rezultate. La maparea la genomul de referință, etichetele derivate dintr-un singur fragment de ADN ar trebui să se suprapună cu genomul de referință la o distanță de aproximativ 3 kb. (această distanță este stabilită atunci când biblioteca este construită) unul față de celălalt și într-o orientare specifică. Deci, dacă distanța dintre etichete este mai mică de 3 kb, aceasta indică prezența unei ștergeri în genomul secvențial, dacă este mai mare, atunci o inserție. Exemple mai complexe de variație structurală a genomului pot fi obținute prin luarea în considerare a site-urilor de cartografiere a etichetelor „incoerente” (de exemplu, inserarea unei secvențe dintr-un alt locus) [2] [6] .
Comparația variațiilor structurale ale genomului la două persoane (un reprezentant al rasei africane și caucazian) a arătat prezența a aproximativ 50% din totalul variațiilor structurale. „Punctele fierbinți” ale variației structurale sunt adesea localizate în locuri din genom asociate cu anumite boli. Variațiile structurale afectează organizarea genomului, deoarece asigură mișcarea exonilor, „fuziunea” genelor, o schimbare a orientării genei sau amplificarea acesteia [6] .
Metoda de secvențiere a capetelor perechi ale ADN-ului a fost folosită și pentru a mapa rearanjamentele genomice ale celulelor canceroase [7] .
Metoda este utilizată pentru a identifica ARNm de lungime completă prin secvențierea capetelor 5’ și 3’ ale bibliotecii de ADNc corespunzătoare [8] [9] . Pe fig. 3. este prezentată schema generală a metodei. Obținerea unei biblioteci de fragmente de capăt împerecheate folosind PCR fără donarea ADNc permite includerea ARNm sau ARNm dificil de clonat cu o concentrație foarte scăzută în analiză. În continuare, biblioteca este secvențializată folosind secvențiere moderne, cum ar fi Illumina GA sau SOLiD v4.
Secvențierea capetelor perechi ale ARN este utilizată pentru analiza calitativă și cantitativă a transcriptomului : determinarea starturilor alternative de inițiere a transcripției , situsurile de poliadenilare și determinarea profilului de expresie a genei. Metoda poate fi, de asemenea, utilizată pentru a identifica genele himerice și cazurile de transsplicing , cu toate acestea, aceste date necesită o verificare experimentală suplimentară.
Avantajul secvențierii capetelor ARNm pereche în comparație cu alte metode de identificare a capetelor 5’ și 3’ ale ARNm, cum ar fi CAGE , SAGE și SuperSAGE , este detectarea ambelor capete ale ARNm în același timp, ceea ce oferă o precizie sporită. în maparea ARNm-ului corespunzător de pe genom. Spre deosebire de metoda de secvențiere a ARN al genomului întreg , care analizează o bibliotecă de fragmente de ARN obținute aleatoriu, secvențierea ARN paired-end-end determină secvențele numai de la capetele moleculelor de ARN, ceea ce reduce semnificativ costul analizei cantitative a transcriptomului, dar nu furnizați informații despre structura internă a ARNm, de exemplu, despre poziția polimorfismelor sau structura exon - intron . În plus, structurile secundare stabile ale ARNm pot complica prepararea cADN-ului de lungime completă și, prin urmare, identificarea ARNm.
Chromatin Interaction Analysis by Paired-End Tag Sequencing (ChIA-PET) este o metodă biologică moleculară care vă permite să determinați interacțiunea (proximitatea spațială) a regiunilor cromatinei situate la o distanță considerabilă unele de altele.de la un prieten din genom. Această metodă face posibilă determinarea de novo a aranjamentului spațial al regiunilor cromatinei una față de alta. Astfel de interacțiuni sunt de interes pentru definirea elementelor de reglare (de exemplu, elemente de reglare cis, elemente de reglare trans, izolatori , amplificatori , amortizoare ). La rândul lor, informațiile obținute sunt importante pentru înțelegerea mecanismelor de reglare a expresiei genelor .