Chip secv

ChIP-seq este o  metodă de analiză a interacțiunii ADN - proteină bazată pe imunoprecipitarea cromatinei (ChIP) și secvențierea ADN-ului de mare capacitate . Metoda a fost dezvoltată pentru a studia modificările histonelor în întregul genom [1] [2] , precum și pentru a căuta site-uri de legare a factorului de transcripție [3] . Anterior, cea mai populară metodă de stabilire a interacțiunilor ADN-proteină a fost ChIP-on-chip , care combină imunoprecipitarea cromatinei cu hibridizarea pe microarrays ADN [4] .

Metodologie

Imunoprecipitarea cromatinei (ChIP)

Imunoprecipitarea cromatinei  este o tehnică utilizată pentru acumularea specifică de secvențe scurte de ADN asociate cu o proteină de interes în celulele vii [5] . O tehnică tipică include următorii pași [5] :

Ca urmare, tot ADN-ul va fi izolat, dar proba va fi îmbogățită cu fragmente cu care a fost asociată proteina studiată [5] .

Secvențiere

Această etapă include determinarea secvenței primare obținute după imunoprecipitarea fragmentelor de ADN prin orice metodă disponibilă. Spre deosebire de ChIP-on-Chip, ChIP-seq folosește secvențierea de generație următoare pentru a determina secvența ADN [6] . În ChIP-seq, secvențierea cu un singur capăt este folosită mai frecvent, dar utilizarea secvențierii cu două capete crește acuratețea mapării (care este deosebit de importantă pentru maparea repetă ) [7] . Rezultatul este un set de secvențe scurte care se suprapun (citește sau citește). De obicei, fragmentele de ADN originale au o lungime de 150-500 bp. , iar citirile rezultate au cel mai adesea o lungime de 50 bp. [7]

Analiză bioinformatică

Analiza bioinformatică include următoarele etape [5] :

Pentru a filtra citirile primite, puteți utiliza pachetele software FastQC și FastX ToolKit [8] . Definiția calității citirilor se bazează pe scorul de calitate Phred  - ponderea care este atribuită fiecărei nucleotide atunci când este citită. Pachetele software precum Gencore , FQStat , Picard și Cutadapt pot fi folosite pentru a evalua și îmbunătăți calitatea citirilor. Gencore elimină citirile duplicate, lăsând o citire de consens. Acest lucru are ca rezultat date mai curate decât simpla eliminare a duplicatelor. Picard este un set de instrumente care vă permite să lucrați cu formate alternative: SAM / BAM / CRAM și VCF. FQStat este un instrument de pachet software autonom, independent de platformă, care evaluează calitatea fișierelor FASTQ utilizând programarea paralelă. În plus, Illumina va oferi un serviciu intern de asigurare a calității pentru citirea filtrului de castitate Illumina. De asemenea, pentru a îmbunătăți calitatea citirilor, „tunderea” poate fi utilă - tăierea capetele citirilor de calitate scăzută care rezultă din nepotrivire (o caracteristică a secvențierii de generație următoare). Tunderea se realizează cu ajutorul programului Trimmomatic [9] . Cartografierea este determinarea cărei regiuni anume și care cromozom au fost citite de o anumită citire. Pentru a mapa citirile la genom, pot fi utilizate pachete software precum BWA , Bowtie , Bowtie 2 și GSNAP [6] . Citirile rezultate din secvențierea paralelă masivă sunt de obicei scurte (100-200 de nucleotide ), în timp ce cromozomul eucariotic mediu este de aproximativ 100 de milioane de nucleotide. Maparea citirilor la genom nu este întotdeauna o sarcină banală din cauza prezenței unui număr mare de repetări în genomul eucariot (de exemplu, LINE și SINE  sunt repetări care reprezintă 17% și 11% din secvența ADN-ului uman ). , respectiv), și astfel citirile repetate pot fi mapate în mai multe locuri simultan. De obicei, citirile mapate unic sunt suficiente pentru analiză (de exemplu, factorii de transcripție ), dar în unele cazuri, citirile mapate în mai multe regiuni sunt de asemenea incluse în analiză [7] . Ca alternativă, pentru a corecta semnalul pierdut în zonele slab mapate, se poate folosi cartografierea, indicator care depinde de diverși parametri experimentali și de analiză, inclusiv lungimea citirilor și programele utilizate pentru prelucrarea datelor [10] . Pachetul software SAMTools [11] [6] poate fi folosit pentru filtrare . După cartografiere, devine posibil să se determine situsurile de legare ale proteinei studiate în genom prin numărul de citiri mapate la acest site (dacă sunt multe, proteina era acolo) [6] . Setul de citiri obținute ca rezultat al imunoprecipitării poate fi nereușit pentru analize ulterioare din cauza adâncimii insuficiente de secvențiere, alegerii proaste a dimensiunii fragmentelor în care ADN-ul a fost scindat în timpul imunoprecipitării sau reprezentării insuficiente a fragmentelor asociate cu proteina sub studiul în amestecul obţinut după imunoprecipitare (anticorpi răi etc.). . P.). Pentru a determina toate cele de mai sus, se utilizează pachetul software CHANCE [8] . După cartografierea citirilor la genom pentru a identifica locurile de legare (regiuni), nivelul de acoperire este mai întâi evaluat. În continuare, sunt identificate vârfurile (zone cu o acoperire mare, unde proteina studiată probabil a fost legată), zgomotul este separat și limitele vârfurilor sunt determinate. Este important să se mențină un echilibru între sensibilitate și specificitate [8] . Unele dintre pachetele software care pot fi folosite pentru a rezolva această problemă sunt SPP , PeakSeq [10] , MACS , MACS 2, UGENE [6] . Rezultatul muncii acestor programe este o listă de regiuni, clasificate fie după mărimea semnalului absolut (adică numărul de citiri) fie după semnificația îmbogățirii (de exemplu, după valoarea p sau FDR ). Alegerea metodei adecvate depinde de specia și proteina studiată și de condițiile experimentale. Diferite programe utilizează ipoteze și ipoteze diferite pentru a calcula valoarea p și FDR. De exemplu, SPP și versiunea originală a MACS utilizează numai date din experimentul și controlul ChIP-Seq (dacă sunt disponibile), în timp ce MOSAiCS ia în considerare scorul de cartografiere și compoziția GC . Prin urmare, este destul de dificil să comparați rezultatele diferiților algoritmi de apelare de vârf. Multe lucrări de potrivire a algoritmului folosesc validarea numărului de vârfuri găsite folosind date din experimente ChIP-on-Chip, qPCR etc. [12] [13] [14] . Situația este complicată și de adnotarea slabă a site-urilor de legare adevărate, așa că atunci când se caută vârfuri pentru o proteină cu un situs de legare necunoscut, trebuie utilizate controale negative [7] . Scopul adnotării este de a stabili o legătură între locul de legare și regiunea ADN funcțională pe care a aterizat situl de legare. Un astfel de site funcțional poate fi un promotor , un site de începere a transcripției , un site intergenic etc. [6] . Intersecția site-urilor de legare prezise cu elementele ADN funcționale poate fi analizată vizual într-unul dintre browserele genomice ; de asemenea, puteți obține un fișier text adnotat folosind Diffbind , CEAS sau ChIPpeakAnno [8] . În vârfurile obținute (lungimea de ordinul a sute de nucleotide), uneori este posibil să se identifice secvențe caracteristice de-a lungul cărora are loc legarea proteinelor - motive (de obicei aproximativ 20 de nucleotide în lungime). Pentru a căuta motive, puteți utiliza algoritmul MEME , Gibbs sampler [8] , ChIPMunk . Dacă motivul de legare este deja cunoscut pentru proteina studiată, atunci prezența acestuia în vârfuri poate servi ca un bun indicator al calității ChIP-seq [8] .

Caracteristicile metodei

La proiectarea experimentului ChIP-seq și la analiza bioinformatică ulterioară, este necesar să se țină cont de câțiva factori și limitări ale tehnicii [7] :

Fragmentare și control neregulat

Disponibilitatea cromatinei în timpul fragmentării nu este aceeași în diferite părți ale genomului: este mai accesibilă în regiunile transcrise activ, astfel încât fragmentele de ADN corespunzătoare vor predomina în probă, ceea ce poate duce la un rezultat fals pozitiv. În schimb, regiunile dens împachetate pot fi mai puțin susceptibile la fragmentare și, prin urmare, pot fi mai puțin reprezentate în eșantion, ceea ce poate duce la un rezultat fals negativ [7] .

Din cauza fragmentării inegale și a altor factori, este important să folosiți controlul corect. Consorțiul ENCODE descrie două tipuri principale de controale [15] . În prima variantă, ADN-ul izolat din celule în aceleași condiții, dar fără precipitare, este utilizat ca martor (așa-numitul control ADN de intrare). În al doilea tip, un alt experiment ChIP este efectuat folosind anticorpi care leagă antigene extranucleare nesemnificative (așa-numitul „control IgG”). În ambele cazuri, adâncimea de secvențiere nu ar trebui să fie mai mică decât adâncimea experimentului ChIP-seq [15] .

Numărul de celule

Tehnica clasică are o serie de limitări. Astfel, ChIP necesită de obicei un număr semnificativ de celule (aproximativ 10 milioane), ceea ce face dificilă aplicarea acestei metode pe organisme model mici și, de asemenea, limitează numărul de experimente care pot fi efectuate cu o probă valoroasă. Pentru a depăși această limitare, au fost dezvoltate o serie de metode bazate pe amplificarea ADN-ului după ChIP-seq (de exemplu, nano-ChIP-seq). ChIP-seq-ul celulelor unice ( ing.  Single-cell ChIP-seq ) este foarte complex din cauza zgomotului de fond cauzat de legarea nespecifică a anticorpilor, iar până la mijlocul celui de-al doilea deceniu al secolului XXI a fost publicată o singură lucrare. în care Single-cell ChIP-seq a fost realizat cu succes. Acest studiu a folosit microfluidica cu picături și, din cauza acoperirii scăzute, mii de celule au trebuit să fie secvențiate pentru a dezvălui eterogenitatea celulară [16] .

Raportul semnal-zgomot

Raportul semnal/zgomot (S/N) este determinat de numărul și puterea vârfurilor obținute pentru fiecare probă și poate fi utilizat pentru estimarea nivelului de zgomot. O valoare mare S/N nu garantează determinarea corectă a site-urilor de legare, ci doar reflectă prezența unui număr mare de regiuni ale genomului la care au fost mapate multe citiri [7] . Pentru a determina acest indicator, ENCODE oferă două metrici [15] :

Adâncimea secvenței

Adâncimea de secvențiere (acoperire) este numărul de citiri unice mapate la o anumită regiune a genomului de referință. Adâncimea de secvențiere afectează detectarea vârfurilor: numărul acestora crește odată cu creșterea adâncimii de secvențiere, deoarece odată cu creșterea numărului de citiri, un număr mai mare de site-uri devine semnificativ statistic [17] . Prin urmare, este necesară secvențierea profundă pentru a recunoaște toate site-urile funcționale [7] .

Valoarea unui nivel suficient de acoperire depinde de raportul semnal-zgomot al anticorpului și poate fi definită ca adâncimea de secvențiere la care raportul dintre numărul de vârfuri dintr-un subset aleatoriu de citiri și numărul de vârfuri de la setul complet de lecturi atinge un platou. O astfel de saturație nu poate fi întotdeauna atinsă (de exemplu, nu există pentru histonele ), iar în astfel de cazuri această valoare este stabilită empiric [7] .

Complexitatea bibliotecii

Complexitatea bibliotecii (NRF) este definită ca raportul dintre numărul de citiri neîmbogățite N nonred și numărul total de citiri mapate N toate . Citirile neîmbogățite sunt definite ca citiri mapate în aceeași regiune a genomului de T ori mai puțin (valoarea lui T este dată ca parametru). Citirile îmbogățite (citurile nu sunt incluse în N nonred ) nu sunt luate în considerare în analiza ulterioară. Pentru un om, parametrul T este de obicei luat egal cu 1, deoarece adâncimea de secvențiere așteptată în acest caz este de obicei mult mai mică de unu. Pentru genomi mici, adâncimea de secvențiere poate fi mai mare decât 1, așa că merită să luăm o valoare mai mare T. Când comparăm NRF pentru diferite probe, merită să ne amintim că aceasta depinde de numărul total de citiri mapate [7] .

NRF scade pe măsură ce crește adâncimea secvențierii bibliotecii. Acest lucru va ajunge în cele din urmă la un punct în care complexitatea va fi maximă și va avea loc secvențierea acelorași fragmente de ADN amplificate prin PCR . Complexitatea scăzută a bibliotecii poate apărea, de exemplu, dacă foarte puțin ADN este eliberat în timpul imunoprecipitării [15] .

Sensibilitate

Sensibilitatea tehnologiei depinde de profunzimea secvențierii, lungimea genomului și de alți factori. Pentru factorii de transcripție la mamifere și modificările cromatinei asociate amplificatorului, care sunt de obicei localizate în situsuri înguste specifice și au de ordinul a o mie de locuri de legare, aproximativ 20 de milioane de citiri vor fi suficiente [6] . Proteinele cu un număr mare de situsuri de legare ( ARN polimeraza III ) necesită până la 60 de milioane de citiri [6] . În cazul factorilor de transcripție viermi sau muște, sunt necesare aproximativ 4 milioane de citiri [6] . Costul secvențierii fragmentelor obținute după imunoprecipitare se corelează direct cu profunzimea secvențierii. Dacă este necesară afișarea cu sensibilitate ridicată a situsurilor de legare ale proteinelor care se găsesc adesea într-un genom mare, vor fi necesare costuri ridicate, deoarece va fi necesar un număr mare de citiri. Acest lucru distinge această metodă de ChIP-on-Chip, în care sensibilitatea nu este legată de costul analizei [6] .

O altă diferență față de metodele ChIP bazate pe micromatrice ADN este că acuratețea ChIP-seq nu este limitată de distanța dintre sondele date. Prin integrarea unui număr mare de citiri scurte, se poate obține localizarea site-urilor de legare cu o precizie ridicată. În comparație cu metodele ChIP-on-Chip, datele ChIP-seq pot fi utilizate pentru a localiza locul real de legare a proteinei la zeci de nucleotide. Densitatea de citire la locurile de legare este un bun indicator al forței legăturii proteină-ADN, ceea ce face mai ușoară cuantificarea și compararea afinității proteinelor pentru diferite site-uri [18] .

Acuratețe și specificitate

Lungimea unui situs tipic de legare a proteinei este de 6-20 de nucleotide, iar lungimea fragmentelor obținute după ChIP este de aproximativ 200, ceea ce face ca determinarea locului de legare să nu fie foarte precisă. În plus, bibliotecile rezultate pot conține adesea regiuni ADN care nu sunt asociate cu proteina studiată, ceea ce duce la erori în rezultate. Există diverse modificări ale metodei care vizează îmbunătățirea acurateței (de exemplu, ChIP-exo). Calitatea experimentului ChIP-seq depinde, de asemenea, direct de specificitatea anticorpilor și de gradul de îmbogățire a probei în stadiul de imunoprecipitare. Principalele probleme pot fi reactivitatea scăzută a anticorpului împotriva proteinei dorite și/sau reactivitatea încrucișată cu alte proteine. Consorțiul ENCODE oferă mai multe metode de evaluare a specificității anticorpilor [15] .

Un epitop poate fi, de asemenea, fuzionat cu proteina de interes pentru a efectua imunoprecipitarea . Această metodă rezolvă ambele probleme care apar în timpul imunoprecipitării anticorpilor, cu toate acestea, în acest caz, eticheta atașată poate afecta proteina studiată (de exemplu, modifica nivelul de expresie sau capacitatea de legare a acesteia) [15] .

Metode alternative

ChIP-on-chip

ChIP-on-chip , care combină imunoprecipitarea cromatinei cu hibridizarea pe microarrays ADN [4] , a fost anterior cea mai populară metodă pentru stabilirea interacțiunilor ADN-proteină. Chip-seq și ChIP-on-chip sunt cele două abordări cele mai utilizate pe scară largă în studiile la nivel de genom ale interacțiunilor ADN-proteină in vivo. Cu toate acestea, o comparație mai detaliată a acestor metode arată avantaje semnificative ale Chip-seq [4] . Comparația dintre metodele Chip-seq și ChIP-on-Chip este prezentată în tabelul [4] :

Index Chip secv Chip-on-Chip
Cantitatea de ADN original mai puțin de 10 ng 4 mcg
Flexibilitatea metodei da: analiza la nivel de genom a oricărui organism secvențial există limitări: disponibilitatea micromatricelor ADN
Precizia determinării poziției locului de legare +/- 50 luni +/- 500 − 1000 luni
Sensibilitate variabilă: prin creșterea numărului de citiri, puteți crește sensibilitatea slab: depinde de calitatea hibridizării
Hibridarea încrucișată (hibridizarea ADN-ului monocatenar cu o sondă care este parțial complementară cu aceasta) exclus: fiecare moleculă de ADN este secvențiată separat poate fi semnificativ, ceea ce reduce foarte mult acuratețea analizei

DamID

DamID (identificarea DNA adenin metiltransferaza) permite cartografierea site-urilor interacțiunilor ADN-proteină în celulele eucariote. Pentru a face acest lucru, celulele exprimă o proteină himerică , constând din proteina de interes și ADN-ul E. coli adenin metiltransferaza (Dam) , care metilează adeninele la secvența GATC. La majoritatea eucariotelor, metilarea adeninei endogene la situsurile GATC nu are loc. Când o proteină de fuziune Dam de interes se leagă de ADN sau de alte proteine ​​asociate ADN-ului, Dam metilează reziduurile de adenină din ADN-ul din jurul situsului de legare, astfel încât această metodă permite marcarea locurilor de interacțiune a proteinei țintă cu ADN și ADN-ul asociat. proteine. Pentru a identifica secvențele metilate de o proteină himerică, fragmentele metilate sunt amplificate selectiv și hibridizate pe microarrays [19] .

Amplificarea selectivă a fragmentelor de ADN metilat se bazează pe un protocol special PCR. În primul rând, ADN-ul metilat la situsurile GATC este tăiat între nucleotidele GAm și TC de către enzima de restricție DpnI . Clivajul cu Dpnl conduce la formarea de fragmente de ADN cu capete contondente 5' TC și 3' GA m . După aceea, adaptoarele dublu-catenare sunt legate la fragmentele obținute. Produsele de ligatură sunt apoi scindate cu endonucleaza de restricție DpnII . DpnII taie ADN-ul la situsurile GATC nemetilate, astfel încât numai fragmentele flancate de situsuri GATC metilate consecutiv (adică site-uri între care nu apar situsuri GATC nemetilate) sunt ulterior amplificate. Apoi, PCR este efectuată cu primeri complementari adaptoarelor și astfel fragmentele genomice cu situsuri GATC metilate la margini sunt amplificate în mod specific [20] .

Modificări de metodă

De la inventarea lui ChIP-Seq, au fost inventate multe modificări ale acestei metode, care permit ca una sau alta subsarcină să fie efectuată mai eficient.

ChIA-PET

Această metodă este folosită pentru a determina interacțiunile regiunilor cromatinei situate la o distanță considerabilă unele de altele în genom [21] . ChIA-PET se bazează pe teoria ligaturii proximale (ligatura de proximitate ), care afirmă că capetele regiunilor cromatinei asociate cu complexul proteic, care sunt în apropiere, vor fi legate între ele cu o probabilitate mai mare decât capetele regiuni care sunt în soluție sau asociate cu un alt complex proteic.

PLAC seq

Există multe metode pentru studiul interacțiunilor pe distanță lungă ale cromatinei, dar necesită un număr mare de celule pentru analiză. Pentru a depăși această limitare, a fost dezvoltată metoda PLAC-seq (Proximity Ligation-Assisted ChIP-seq), în care reticularea regiunilor contigue este efectuată în nucleu înainte de fragmentarea cromatinei și imunoprecipitarea. PLAC-seq demonstrează acuratețe, performanță și reproductibilitate superioare în comparație cu ChIA-PET în determinarea contactelor la distanță lungă în celulele de mamifere [22] .

Nano-ChIP seq

Metoda nano-ChIP-seq se bazează pe faptul că ADN-ul izolat în timpul experimentului ChIP este amplificat prin PCR și apoi secvențial [23] . Acest lucru permite efectuarea analizei pe un număr mic de celule, de obicei în jur de 10.000. Cu toate acestea, un număr suficient de celule depinde de mulți factori, precum eficacitatea anticorpilor și îmbogățirea probei cu proteina țintă, astfel încât în ​​unele cazuri pot fi necesare mai mult de 10 mii de celule [23] .

ChIP-exo și ChIP-nexus

Metoda ChIP-exo  este o modificare a protocolului ChIP-seq care îmbunătățește rezoluția site-urilor de legare găsite de la sute de perechi de baze la aproape o nucleotidă. ChIP-exo folosește λ-exonucleaza pentru a îndepărta ADN-ul contaminant și capetele 5’ ale fragmentelor de ADN legate de proteina țintă până la o poziție la o anumită distanță fixă ​​de locul de legare a proteinei [24] . Deoarece fragmentele de ADN ale ambelor catene sunt formate ca rezultat al experimentului ChIP, capetele 5’ aliniate sunt mapate la două poziții ale genomului, între care se află situsul de legare a proteinei. Experimentele cu drojdie au arătat că ChIP-exo permite identificarea site-urilor de legare cu precizie nucleotidică și raport semnal-zgomot de 40 de ori mai mare în comparație cu ChIP-seq și ChIP-on-Chip [24] .

O modificare a protocolului ChIP-exo este protocolul ChIP-nexus [25] (experimentele ChIP cu rezoluție nucleotidică prin exonuclează, cod de bare unic și ligatură unică). În acest protocol, adaptori speciali sunt legați la ADN, care conțin o pereche de secvențe pentru amplificarea bibliotecii, un situs al enzimei de restricție BamHI și un cod de bare randomizat care permite urmărirea supraamplificării fragmentelor. Ca și în protocolul ChIP-exo, se efectuează tratamentul cu λ-exonuclează, care scindează ADN-ul de la capătul 5’ la un obstacol fizic sub forma unei proteine ​​legate de ADN. După aceea, se efectuează circularizarea intramoleculară a ADN-ului și apoi reliniarizarea prin tratament cu enzima de restricție BamHI [25] . Astfel, la marginile fragmentului de interes sunt secvențe pentru amplificare. Acest pas suplimentar îmbunătățește eficiența încorporării fragmentelor de ADN în bibliotecă [25] .

Competition-ChIP

Competition-ChIP  este o modificare a protocolului ChIP-seq utilizat pentru a măsura dinamica relativă a legării factorului de transcripție la ADN [26] . Ideea metodei se bazează pe exprimarea a două copii ale factorului de transcripție studiat cu semne epitopice diferite . Una dintre aceste copii este exprimată în mod permanent, iar expresia celui de-al doilea, acționând ca un concurent, este inductibilă. Raportul izoformelor asociate cu anumite loci este determinat fie folosind ChIP-seq, fie ChIP-on-chip. Rata cu care o formă exprimată constitutiv este înlocuită cu una inductibilă face posibilă calcularea timpului de rezidență al factorului studiat la fiecare loc de legare.

CLIP seq

CLIP-seq (cunoscut și sub denumirea de HITS-CLIP  - high-throughput sequencing a ARN izolat prin imunoprecipitare prin reticulare) este o metodă pentru studierea interacțiunilor ARN-proteină și a modificărilor ARN in vivo [27] .

DRIP-seq și DRIVE-seq

Buclele R sunt structuri cu trei catenari formate din ADN monocatenar deplasat (ssDNA) și un duplex ARN-ssDNA . In vivo , ele reprezintă aproximativ 5-8% din genom. Prin reglarea legării diferitelor proteine, buclele R sunt implicate în multe procese celulare, cum ar fi, de exemplu, diferențierea celulelor stem embrionare [28] . Pentru a studia buclele R, a fost dezvoltată metoda DRIP-seq (ADN:ARN ImmunoPrecipitation and sequencing), care este în esență foarte asemănătoare cu ChIP-Seq, dar se bazează pe utilizarea anticorpilor specifici buclelor R [29]. ] . O altă modalitate de a studia buclele R este metoda DRIVE-seq (ADN:ARN In Vitro Enrichment and sequencing), care utilizează endonucleaza MBP-RNASEH1 inactivată în loc de anticorpi [29] . DRIVE-seq poate fi folosit pentru a rafina predicțiile făcute cu DRIP-seq. Ambele metode fac posibilă cuantificarea precisă și practică a numărului de bucle R. Pentru prima dată, DRIP-seq a fost folosit pentru a studia buclele R din genomul uman: s-a demonstrat că un număr mare dintre ele sunt conținute în insulele CpG promotorilor [29] .

CETCh-seq

Metoda CETCh-seq a fost concepută pentru a depăși o astfel de problemă tehnică precum disponibilitatea anticorpilor adecvați pentru experimentele ChIP-seq atunci când se studiază interacțiunile ADN-proteină. Folosind editarea genomică folosind CRISPR/Cas9 , se adaugă un epitop la proteinele de interes, cum ar fi factorii de transcripție, pentru recunoașterea ulterioară de către anticorpi adecvați [30] .

CUT&RUN

CUT&RUN  este o modificare a ChIP-seq care vă permite să creșteți foarte mult raportul semnal-zgomot. Efectul se realizează prin utilizarea nucleazei micrococice , fuzionată cu proteina A , în stadiul de imunoprecipitare [31] .

CUT&Tag

CUT&Tag  este o metodă similară cu CUT&RUN, dar transpozaza Tn5este utilizată în locul nucleazei micrococice . Avantajul acestei metode față de CUT&RUN este că nu necesită liza celulară și fracționarea cromatinei [32] .

Aplicație

ChIP-seq este în principiu aplicabil oricăror proteine ​​care precipită în timpul imunoprecipitării cromatinei. Un exemplu tipic de utilizare a metodei ChIP-seq este determinarea situsurilor de legare pentru factorii de transcripție, ADN polimeraza , proteinele structurale, precum și modificările histonelor și structura cromatinei [6] . Ca alternativă la ChIP-seq, au fost dezvoltate o serie de metode de non-imunoprecipitare ( DNase-Seq și FAIRE-Seq ) pentru a detecta regiunile ADN fără nucleozomi [6] .

Caută motive

Unul dintre obiectivele principale ale experimentelor ChIP-seq este căutarea motivelor secvenței ADN pentru legarea proteinelor. Regiunile ADN în contact fizic cu factorii de transcripție și alte proteine ​​pot fi izolate prin imunoprecipitarea cromatinei. În timpul experimentului, se obține un set de fragmente de ADN asociate cu proteina studiată in vivo . Analiza ulterioară include utilizarea unei secvențieri paralele masive și a bazelor de date ale genomului întreg pentru a determina poziția site-urilor de legare în genom [6] . Cel mai utilizat instrument de detectare a motivelor este algoritmul MEME (Multiple EM for Motif Elicitation). Adesea, multe motive pot fi găsite pe baza unui singur set de date și analiza motivelor poate fi efectuată chiar și pe date ChIP-seq de calitate scăzută, dar semnificația și fiabilitatea acestor motive vor fi mai scăzute [33] .

Găsirea site-urilor cu funcție biologică

Datele din experimentele ChIP-seq sunt adesea folosite pentru a identifica regiunile de reglementare pentru un locus de interes [15] . În special, ChIP-seq este utilizat pe scară largă pentru a studia regulonii bacterieni [34] . Pentru a face acest lucru, după găsirea site-urilor de legare, se face o căutare pentru gene reglate presupuse [34] .

Analiză diferențială

Diferențele dintre profilurile ChIP-Seq în diferite condiții sunt determinate după apelarea vârfurilor. Vârfurile obținute în diferite experimente sunt apoi îmbinate într-o singură listă. Pentru a identifica în continuare situsurile candidate, sunt adesea folosite programe pentru analiza diferențială a expresiei genelor , cum ar fi DESeq2 [35] și edgeR [36] . Aceste programe sunt capabile să efectueze analize diferențiale tratând listele de vârfuri rezultate ca liste de „gene”. Există, de asemenea, programe concepute special pentru analiza diferențială a datelor ChIP-Seq (de ex. DiffBind [37] , ChIPComp [38] , DBChIP [39] ) care funcționează pe un principiu similar. Multe alte programe (de exemplu, PePr [40] ) folosesc modele care nu necesită apelarea preliminară a vârfurilor [40] .

Studiul stării cromatinei

Metilarea ADN-ului și modificările histonelor suferă modificări puternice în timpul tranzițiilor de dezvoltare și în boli precum cancerul și, astfel, aduc o contribuție majoră la natura dinamică a cromatinei. Diverse modificări ale histonelor sunt examinate folosind anticorpi specifici pentru a obține un profil al semnelor de histonă din probă. În propriile experimente, consorțiul ENCODE testează cu atenție specificitatea anticorpilor utilizați pe o varietate de peptide terminale ale histonelor modificate diferit. Sursele comune de celule sunt, de asemenea, utilizate și profilate și comparate pentru a asigura coerența între experimente. Orientările actuale de la consorțiul ENCODE acoperă validarea anticorpilor, reproductibilitatea experimentală, adâncimea secvenței, analiza calității datelor și publicarea datelor și a metadatelor [33] [41] .

Analiza dezechilibrului alelic

Un interes din ce în ce mai mare este analiza datelor ChIP-Seq cu un control intern pentru o alelă diferită pentru a identifica dezechilibrul alelic [42] . În același timp, datele obținute din experimentul ChIP-Seq sunt folosite pentru a căuta relația semnalelor biologice cu polimorfismele cu un singur nucleotide (SNP) [42] . Această analiză include trei etape [43] :

  1. alinierea citirilor, adică determinând poziția în genom și alela pentru fiecare citire,
  2. numărarea numărului de citiri mapate fiabil pentru fiecare SNP pentru fiecare alelă,
  3. clasarea posibilelor SNP și evaluarea statistică a dezechilibrului alelic.

Pentru primele două etape, strategia corectă de cartografiere a citirilor la genomul de referință este importantă, deoarece este necesar să se distingă erorile de secvențiere de alelele reale. Pentru a treia etapă au fost dezvoltate mai multe programe folosind diferite teste statistice, precum AlleleDB [44] , NPBin [42] și WASP [45] .

Baze de date

Genomul organismelor multicelulare este extrem de complex și nu este complet clar în detaliu cum are loc implementarea informațiilor ereditare. O înțelegere detaliată a funcționării genomului necesită o listă completă de elemente funcționale și o descriere a modului în care acestea funcționează în timp și în diferite tipuri de celule. În încercarea de a rezolva această problemă, au fost create proiectele ENCODE și modENCODE [46] . În plus față de rezultatele ChIP-seq, ENCODE și modENCODE integrează date din analize precum 5C și ChIA-PET pentru a determina conformația cromozomală; DNase-seq și FAIRE-Seq pentru a identifica regiunile fără nucleozomi; secvențierea bisulfiților și testul de metilare Infinium pentru a determina prezența metilcitozinelor în ADN, RT-PCR și secvențierea ARN pentru a determina nivelul de expresie a genei, precum și CLIP-seq și RIP-seq pentru a identifica proteina ARN interacțiuni [ 46] .

Începând cu al doilea deceniu al secolului al XXI-lea, există o serie de baze de date care conțin rezultatele experimentelor ChIP-seq și analiza acestora:

Cercetare

Eucariote

Un exemplu de utilizare cu succes a ChIP-seq pentru a studia eucariotele este studiul arhitecturii nucleozomilor promotorilor . Folosind ChIP-seq, a fost posibil să se stabilească că drojdia poate avea regiuni promotoare fără nucleozomi (aproximativ 150 bp lungime), din care ARN polimeraza poate iniția transcripția [60] . Această metodă a fost, de asemenea, aplicată cu succes pentru a căuta locuri de legare pentru 22 de factori de transcripție în genomul nematodului C. elegans . Pentru 20% din toate genele adnotate ale genomului nematodului, au fost determinați factorii de transcripție care le reglează [61] .

ChIP-seq este, de asemenea, utilizat pe scară largă pentru a studia modificările histonelor. Sunt cunoscute peste 100 de modificări ale histonelor [62] [63] . De exemplu, se știe că acetilarea, în special acetilarea lizinei 9 a histonei H3 (H3K9Ac), este de obicei asociată cu regiuni deschise și accesibile ale cromatinei ( eucromatină ). În același timp, metilarea histonelor poate fi asociată atât cu regiuni deschise, cât și cu regiuni dens de cromatina ( heterocromatina ). În special, mono- și trimetilarea lizinei 4 a histonei H3 (H3K4me1 sau H3K4me3) este de obicei asociată cu cromatina deschisă și fiecare dintre aceste semne reprezintă o categorie specială de cromatina deschisă: H3K4me3 marchează regiunile promotoare, H3K4me1 marchează amplificatori transcripționali, H3K4me3 marchează regiuni transcrise ale genomului . Trimetilarea lizinelor 9 și 27 ale histonei H3 (H3K9me3 și H3K27me3), dimpotrivă, este asociată cu compactarea cromatinei și, în consecință, cu reprimarea genelor . H3K9me3 și H3K27me3 reglează diferite tipuri de gene: H3K27me3 reprimă predominant factorii de transcripție homeobox , în timp ce genele țintă H3K9me3 sunt predominant factori de transcripție cu degetul de zinc [64 ] . Diverse combinații de semne de histonă pot oferi informații și mai detaliate: de exemplu, prezența a două mărci H3K4me3 (semne de eucromatină) și H3K9me3 (semne de heterocromatină) pe promotor poate fi un identificator al genelor imprimate [65] .

Procariote

La bacterii, reglarea expresiei genelor la nivelul transcripției se realizează cu ajutorul factorilor de transcripție [66] . Metoda ChIP-seq poate fi utilizată pentru a identifica situsurile de legare pentru astfel de factori de transcripție. Unii factori de transcripție bacterieni au mai multe situsuri de legare în cadrul promotorului (adică, situsuri la mai puțin de 100 bp unul de celălalt) [67] . Majoritatea algoritmilor de căutare de vârf identifică astfel de site-uri apropiate ca fiind unul singur. Pentru a rezolva această problemă, se folosesc așa-numiții algoritmi de deconvoluție de vârf, de exemplu, CSDeconv [68] , GEM [69] , PICS [70] sau dPeak [71] .

Următorul pas după determinarea situsurilor de legare este determinarea genelor reglate. De obicei, asocierea vârfurilor găsite cu genele se realizează algoritmic prin căutarea site-urilor de început a transcripției (TSS) din apropiere. Cu toate acestea, în cazul bacteriilor (inclusiv E. coli ), este posibil ca TSS să nu fie determinat pentru multe gene, așa că în loc de TSS, se pot căuta site-uri de început a traducerii din apropiere, se pot examina manual mediul genomic al vârfului sau se poate folosi expresia genei. date (de exemplu, comparați expresia regulonului de tip sălbatic).și în cazul ștergerii factorului de transcripție studiat pe baza datelor ARN-seq) [34] .

Perspective de dezvoltare

Progresele actuale în metoda ChIP-seq permit deja analiza probelor care conțin mult mai puține celule, extinzându-și foarte mult aplicabilitatea în domenii precum embriologia și biologia dezvoltării, unde obținerea de probe mari este prea costisitoare sau dificilă. Metoda are cu siguranță potențialul de a detecta mutații în situsurile de legare care afectează legarea proteinelor și reglarea expresiei genelor [6] .

Cu toate acestea, devine clar că problemele ChIP-seq necesită noi soluții experimentale, statistice și de calcul. Este necesar să se reducă numărul de artefacte și rezultate fals pozitive, precum și să se învețe să distingă efectele individuale ale fenomenelor studiate de cele dependente de context. Noile dezvoltări importante sunt legate de descoperirea și analiza regiunilor reglatoare distale (situate la o distanță considerabilă de genă). Posibil, folosind ChIP-seq va fi posibil să se determine legarea indirectă de ADN, de exemplu, prin proteine ​​suplimentare sau complexe proteice, deoarece situsurile prezise pot fi funcționale indiferent de prezența unui motiv specific. În cele din urmă, informații suplimentare (cum ar fi nivelul de expresie sau datele conformației cromatinei) trebuie utilizate pentru a distinge funcționalitatea reală, deoarece legarea ADN-ului nu implică neapărat o funcție specifică [18] .

O direcție promițătoare este integrarea datelor obținute dintr-un număr mare de experimente pentru a rezolva și analiza interacțiuni complexe. În acest scop sunt adesea folosite diverse metode de învățare automată [72] [73] [74] .

Note

  1. Mikkelsen TS , Ku M. , Jaffe DB , Issac B. , Lieberman E. , Giannoukos G. , Alvarez P. , Brockman W. , Kim TK , Koche RP , Lee W. , Mendenhall E. , O'Donovan A. , Presser A. , ​​Russ C. , Xie X. , Meissner A. , ​​Wernig M. , Jaenisch R. , Nusbaum C. , Lander ES , Bernstein BE .  (engleză)  // Natură. - 2007. - Vol. 448, nr. 7153 . - P. 553-560. - doi : 10.1038/nature06008 . — PMID 17603471 .
  2. ^ Barski A. , Cuddapah S. , Cui K. , Roh TY , Schones DE , Wang Z. , Wei G. , Chepelev I. , Zhao K. High-resolution profile of hisstone methylations in the human genome.  (engleză)  // Cell. - 2007. - Vol. 129, nr. 4 . - P. 823-837. - doi : 10.1016/j.cell.2007.05.009 . — PMID 17512414 .
  3. Johnson DS , Mortazavi A. , Myers RM , Wold B. Genome-wide mapping of in vivo protein-ADN interactions.  (engleză)  // Știință (New York, NY). - 2007. - Vol. 316, nr. 5830 . - P. 1497-1502. - doi : 10.1126/science.1141319 . — PMID 17540862 .
  4. ↑ 1 2 3 4 Park PJ ChIP-seq: avantajele și provocările unei tehnologii în curs de maturizare.  (engleză)  // Recenzii de natură. genetica. - 2009. - Vol. 10, nr. 10 . - P. 669-680. doi : 10.1038 / nrg2641 . — PMID 19736561 .
  5. ↑ 1 2 3 4 Barbara Kaboord, Maria Perr. Izolarea proteinelor și a complexelor proteice prin imunoprecipitare  //  Methods in Molecular Biology (Clifton, NJ). — 01-01-2008. — Vol. 424 . — P. 349–364 . — ISSN 1064-3745 . - doi : 10.1007/978-1-60327-064-9_27 . Arhivat din original pe 23 aprilie 2017.
  6. ↑ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Terrence S. Furey. ChIP-seq și nu numai: metodologii noi și îmbunătățite pentru a detecta și caracteriza interacțiunile proteină-ADN  //  Nature Reviews. genetica. — 01-12-2012. — Vol. 13 , iss. 12 . — P. 840–852 . — ISSN 1471-0064 . - doi : 10.1038/nrg3306 . Arhivat din original pe 23 aprilie 2017.
  7. ↑ 1 2 3 4 5 6 7 8 9 10 Ryuichiro Nakato, Katsuhiko Shirahige. Progrese recente în analiza ChIP-seq: de la managementul calității la adnotarea întregului genom  //  Briefings in Bioinformatics. — 15-03-2016. —P.bbw023 . _ - ISSN 1477-4054 ​​​​1467-5463, 1477-4054 . - doi : 10.1093/bib/bbw023 . Arhivat din original pe 21 ianuarie 2022.
  8. ↑ 1 2 3 4 5 6 Timothy Bailey, Pawel Krajewski, Istvan Ladunga, Celine Lefebvre, Qunhua Li. Orientări practice pentru analiza cuprinzătoare a datelor ChIP-seq  //  Biologie computațională PLoS. — 01-01-2013. — Vol. 9 , iss. 11 . — P.e1003326 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003326 . Arhivat din original pe 4 mai 2017.
  9. Anthony M. Bolger, Marc Lohse, Bjoern Usadel. Trimmomatic: un trimmer flexibil pentru datele secvenței Illumina   // Bioinformatică . — 01-08-2014. — Vol. 30 , iss. 15 . — P. 2114–2120 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btu170 . Arhivat din original pe 24 aprilie 2017.
  10. ↑ 1 2 Joel Rozowsky, Ghia Euskirchen, Raymond K Auerbach, Zhengdong D Zhang, Theodore Gibson. PeakSeq permite notarea sistematică a experimentelor ChIP-seq în raport cu controalele  //  Nature Biotechnology. — 2009-1. — Vol. 27 , iss. 1 . — P. 66–75 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1518 . Arhivat din original pe 30 martie 2019.
  11. Heng Li, Bob Handsaker, Alec Wysoker, Tim Fennell, Jue Ruan. Formatul Sequence Alignment/Map și SAMtools  (engleză)  // Bioinformatică. — 15-08-2009. — Vol. 25 , iss. 16 . — P. 2078–2079 . — ISSN 1367-4803 . - doi : 10.1093/bioinformatics/btp352 . Arhivat din original pe 24 aprilie 2017.
  12. Hashem Koohy, Thomas A. Down, Mihail Spivakov, Tim Hubbard. O comparație a apelanților de vârf utilizați pentru datele DNase-Seq  // PLoS ONE. — 08-05-2014. - T. 9 , nr. 5 . — S. e96303 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0096303 .
  13. Elizabeth G. Wilbanks, Marc T. Facciotti. Evaluarea performanței algoritmului în detectarea vârfurilor ChIP-Seq  // PLoS ONE. — 08-07-2010. - T. 5 , nr. 7 . — S. e11471 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0011471 .
  14. Teemu D Laajala, Sunil Raghav, Soile Tuomela, Riitta Lahesmaa, Tero Aittokallio. O comparație practică a metodelor pentru detectarea situsurilor de legare a factorului de transcripție în experimentele ChIP-seq  // BMC Genomics. - 2009. - T. 10 , nr. 1 . - S. 618 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-10-618 .
  15. ↑ 1 2 3 4 5 6 7 S. G. Landt, G. K. Marinov, A. Kundaje, P. Kheradpour, F. Pauli. Ghidurile și practicile ChIP-seq ale consorțiilor ENCODE și modENCODE  (engleză)  // Cercetarea genomului. — 01-09-2012. — Vol. 22 , iss. 9 . — P. 1813–1831 . — ISSN 1088-9051 . - doi : 10.1101/gr.136184.111 .
  16. Assaf Rotem, Oren Ram, Noam Shoresh, Ralph A. Sperling, Alon Goren. ChIP-seq cu o singură celulă dezvăluie subpopulații celulare definite de starea cromatinei  // Biotehnologia naturii. — 2015-11. - T. 33 , nr. 11 . - S. 1165-1172 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3383 . Arhivat din original pe 21 mai 2016.
  17. Consorțiul Proiectului ENCODE. A User's Guide to the Encyclopedia of DNA Elements (ENCODE  )  // PLoS Biology / Peter B. Becker. — 19-04-2011. — Vol. 9 , iss. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  18. 1 2 Joshua WK Ho, Eric Bishop, Peter V. Karchenko, Nicolas Nègre, Kevin P. White. Chip-chip versus ChIP-seq: lecții pentru design experimental și analiza datelor  (engleză)  // BMC genomics. — 28-02-2011. — Vol. 12 . — P. 134 . — ISSN 1471-2164 . - doi : 10.1186/1471-2164-12-134 . Arhivat din original pe 4 mai 2017.
  19. Frauke Greil, Celine Moorman, Bas van Steensel. [16 DamID: Mapping of In Vivo Protein-Genome Interactions Using Tethered DNA Adenin Methyltransferase]  //  Metode în enzimologie. - Elsevier, 2006. - Vol. 410 . — P. 342–359 . — ISBN 9780121828158 . - doi : 10.1016/s0076-6879(06)10016-6 . Arhivat 12 mai 2019.
  20. Bas van Steensel, Daniel Peric-Hupkes, Maartje J. Vogel. Detectarea interacțiunilor proteine-ADN in vivo folosind DamID în celulele de mamifere  (engleză)  // Nature Protocols. — 2007-06. — Vol. 2 , iss. 6 . — P. 1467–1478 . — ISSN 1750-2799 . - doi : 10.1038/nprot.2007.148 . Arhivat 25 mai 2021.
  21. Yi Eve Sun, Weihong Ge. Evaluarea Facultății de 1000 pentru un interactom de cromatină umană legat de receptorul de estrogen-alfa. . F1000 - Evaluare inter pares post-publicare a literaturii biomedicale (4 decembrie 2009). Data accesului: 18 aprilie 2020.
  22. Rongxin Fang, Miao Yu, Guoqiang Li, Sora Chee, Tristin Liu. Cartografierea interacțiunilor cromatinei pe distanță lungă prin ChIP-seq asistată de ligarea de proximitate  //  Cell Research. — 2016-12. — Vol. 26 , iss. 12 . — P. 1345–1348 . — ISSN 1748-7838 1001-0602, 1748-7838 . - doi : 10.1038/cr.2016.137 . Arhivat din original pe 30 martie 2019.
  23. ↑ 1 2 Mazhar Adli, Bradley E Bernstein. Profilul cromatinei întregului genom din un număr limitat de celule folosind nano-ChIP-seq  //  Nature Protocols. — 2011-10. — Vol. 6 , iss. 10 . — P. 1656–1668 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2011.402 . Arhivat din original pe 18 aprilie 2019.
  24. ↑ 1 2 Ho Sung Rhee, B. Franklin Pugh. Interacțiuni cuprinzătoare proteine-ADN la nivel de genom detectate la rezoluția cu un singur nucleotidă   // Celulă . — 2011-12. — Vol. 147 , iss. 6 . - P. 1408-1419 . - doi : 10.1016/j.cell.2011.11.013 . Arhivat din original pe 18 aprilie 2019.
  25. ↑ 1 2 3 Qiye He, Jeff Johnston, Julia Zeitlinger. ChIP-nexus: un nou protocol ChIP-exo pentru detectarea îmbunătățită a amprentelor de legare a factorului de transcripție in vivo  // Biotehnologia naturii. — 2015-4. - T. 33 , nr. 4 . — S. 395–401 . — ISSN 1087-0156 . - doi : 10.1038/nbt.3121 .
  26. Colin R Lickwar, Florian Mueller, Jason D Lieb. Măsurarea la nivel de genom a dinamicii de legare a proteinei-ADN utilizând Chip de competiție  //  Protocoale de natură. — 2013-7. — Vol. 8 , iss. 7 . - P. 1337-1353 . — ISSN 1750-2799 1754-2189, 1750-2799 . - doi : 10.1038/nprot.2013.077 . Arhivat din original pe 20 aprilie 2019.
  27. Robert B. Darnell. HITS-CLIP: vederi panoramice ale reglării proteinelor-ARN în celulele vii  //  Wiley Interdisciplinary Reviews: ARN. — 2010-9. — Vol. 1 , iss. 2 . — P. 266–286 . - ISSN 1757-7012 1757-7004, 1757-7012 . - doi : 10.1002/wrna.31 . Arhivat din original pe 20 aprilie 2019.
  28. László Halász, Zsolt Karányi, Beáta Boros-Oláh, Tímea Kuik-Rózsa, Éva Sipos. Cartografierea imunoprecipitării hibride ARN-ADN (bucla R): un flux de lucru analitic pentru a evalua părtinirile inerente  //  Cercetarea genomului. — 2017-6. — Vol. 27 , iss. 6 . — P. 1063–1073 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.219394.116 .
  29. ↑ 1 2 3 Paul A. Ginno, Paul L. Lott, Holly C. Christensen, Ian Korf, Frédéric Chédin. Formarea R-Loop este o caracteristică distinctivă a promotorilor insulei CpG umane nemetilate  //  Celulă moleculară. — 2012-3. — Vol. 45 , iss. 6 . — P. 814–825 . - doi : 10.1016/j.molcel.2012.01.017 . Arhivat din original pe 20 aprilie 2019.
  30. Daniel Savic, E. Christopher Partridge, Kimberly M. Newberry, Sophia B. Smith, Sarah K. Meadows. CETCh-seq: Etichetarea epitopului CRISPR ChIP-seq of DNA-binding proteins  (engleză)  // Genome Research. — 2015-10. — Vol. 25 , iss. 10 . - P. 1581-1589 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.193540.115 .
  31. Peter J Skene, Steven Henikoff. O strategie eficientă de nuclează țintită pentru cartografierea de înaltă rezoluție a site-urilor de legare a ADN-ului   // eLife . — 16-01-2017. — Vol. 6 . — P. e21856 . — ISSN 2050-084X . - doi : 10.7554/eLife.21856 . Arhivat 13 mai 2020.
  32. M. Robyn Andersen, Kelsey Afdem, Marcia Gaul, Shelly Hager, Erin Sweet. Istoricul familial, genetica și alte credințe legate de cauză printre supraviețuitorii cancerului de sân  // OBM Genetics. — 27.02.2019. - T. 3 , nr. 3 . — S. 1–1 . — ISSN 2577-5790 . - doi : 10.21926/obm.genet.1903087 .
  33. ↑ 1 2 Privire de ansamblu secvențiere Chip . epigenie.com. Preluat la 22 aprilie 2019. Arhivat din original la 22 aprilie 2019.
  34. ↑ 1 2 3 Kevin S. Myers, Dan M. Park, Nicole A. Beauchene, Patricia J. Kiley. Definirea regulilor bacterieni folosind ChIP-seq   // Metode . — 2015-9. — Vol. 86 . — P. 80–88 . - doi : 10.1016/j.ymeth.2015.05.022 . Arhivat 2 mai 2019.
  35. Michael I Love, Wolfgang Huber, Simon Anders. Estimarea moderată a schimbării orificiului și a dispersiei pentru datele ARN-seq cu DESeq2  // Biologia genomului. — 2014-12. - T. 15 , nr. 12 . — ISSN 1474-760X . - doi : 10.1186/s13059-014-0550-8 .
  36. MD Robinson, DJ McCarthy, GK Smyth. edgeR: un pachet Bioconductor pentru analiza expresiei diferențiale a datelor digitale de exprimare a genelor  // Bioinformatică. — 2009-11-11. - T. 26 , nr. 1 . — S. 139–140 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btp616 .
  37. Anais Bardet. Peak Calling  // Ghid practic pentru analiza datelor ChIP-seq. — CRC Press, 2018-10-26. — S. 41–52 . — ISBN 9780429487590 .
  38. Li Chen, Chi Wang, Zhaohui S. Qin, Hao Wu. O nouă metodă statistică pentru compararea cantitativă a mai multor seturi de date ChIP-seq  // Bioinformatică. — 13-02-2015. - T. 31 , nr. 12 . — S. 1889–1896 . - ISSN 1460-2059 1367-4803, 1460-2059 . - doi : 10.1093/bioinformatics/btv094 .
  39. Kun Liang, Sundüz Keleş. Detectarea legării diferențiale a factorilor de transcripție cu ChIP-seq  // Bioinformatică. — 03-11-2011. - T. 28 , nr. 1 . — S. 121–122 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btr605 .
  40. ↑ 1 2 Yanxiao Zhang, Yu-Hsuan Lin, Timothy D. Johnson, Laura S. Rozek, Maureen A. Sartor. PePr: o conductă de prioritizare a apelurilor de vârf pentru a identifica vârfuri consistente sau diferențiate din datele replicate ChIP-Seq  // Bioinformatică. — 03-06-2014. - T. 30 , nr. 18 . — S. 2568–2575 . - ISSN 1367-4803 1460-2059, 1367-4803 . - doi : 10.1093/bioinformatics/btu372 .
  41. Bradley E Bernstein, John A Stamatoyannopoulos, Joseph F Costello, Bing Ren, Aleksandar Milosavljevic. NIH Roadmap Epigenomics Mapping Consortium  // Biotehnologia naturii. — 2010-10. - T. 28 , nr. 10 . — S. 1045–1048 . — ISSN 1087-0156 . - doi : 10.1038/nbt1010-1045 . Arhivat din original pe 22 mai 2016.
  42. ↑ 1 2 3 Qi Zhang, Sündüz Keleş. Un test empiric Bayes pentru detectarea dezechilibrului alelic în ChIP-seq  // Biostatistics. — 03-11-2017. - T. 19 , nr. 4 . — S. 546–561 . — ISSN 1468-4357 1465-4644, 1468-4357 . - doi : 10.1093/biostatistics/kxx060 .
  43. Qi Zhang. Analiza datelor Experimentelor ChIP-Seq  //  Epigenetică și boli computaționale. — Elsevier, 2019. — P. 67–77 . — ISBN 9780128145135 . - doi : 10.1016/b978-0-12-814513-5.00005-2 . Arhivat 5 mai 2019.
  44. Christopher Gregg. Evaluarea Facultății de 1000 pentru Un studiu uniform al legării și expresiei specifice alelelor peste 1000 de indivizi din proiectul genomilor. . F1000 - Evaluare peer post-publicare a literaturii biomedicale (11 iulie 2016). Preluat: 5 mai 2019.
  45. Bryce van de Geijn, Graham McVicker, Yoav Gilad, Jonathan K Pritchard. WASP: software specific alelelor pentru descoperirea locusurilor de trăsături cantitative moleculare robuste  // Nature Methods. — 14.09.2015. - T. 12 , nr. 11 . — S. 1061–1063 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.3582 .
  46. ↑ 1 2 Susan E. Celniker, Laura AL Dillon, Mark B. Gerstein, Kristin C. Gunsalus, Steven Henikoff. Deblocarea secretelor genomului   // Natura . — 18-06-2009. — Vol. 459 , iss. 7249 . — P. 927–930 . — ISSN 1476-4687 . - doi : 10.1038/459927a . Arhivat din original pe 29 aprilie 2017.
  47. Hongzhu Qu, Xiangdong Fang. O scurtă trecere în revistă a proiectului Enciclopedia umană a elementelor ADN ( ENCODE  )  // Genomics, Proteomics & Bioinformatics. — 2013-06-01. — Vol. 11 , iss. 3 . — P. 135–141 . — ISSN 2210-3244 . - doi : 10.1016/j.gpb.2013.05.001 . Arhivat din original pe 5 mai 2017.
  48. Oki, S; Ohta, T. ChIP-Atlas . - 2015. - doi : 10.18908/lsdba.nbdc01558-000 .
  49. Consorțiul modENCODE, Sushmita Roy, Jason Ernst, Peter V. Kharchenko, Pouya Kheradpour. Identificarea elementelor funcționale și a circuitelor de reglare de către Drosophila modENCODE  (engleză)  // Science (New York, NY). — 24.12.2010. — Vol. 330 , iss. 6012 . — P. 1787–1797 . — ISSN 1095-9203 . - doi : 10.1126/science.1198374 . Arhivat din original pe 5 mai 2017.
  50. Jie Wang, Jiali Zhuang, Sowmya Iyer, Xin-Ying Lin, Melissa C. Greven. Factorbook.org: o bază de date bazată pe Wiki pentru datele de legare a factorilor de transcripție generate de consorțiul ENCODE  //  Nucleic Acids Research. — 01-01-2013. — Vol. 41 , iss. Problema baza de date . — P. D171–176 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1221 . Arhivat din original pe 5 mai 2017.
  51. Jian-Hua Yang, Jun-Hao Li, Shan Jiang, Hui Zhou, Liang-Hu Qu. ChIPBase: o bază de date pentru decodificarea reglementării transcripționale a genelor lungi necodante de ARN și microARN din datele ChIP-Seq  //  Nucleic Acids Research. — 01-01-2013. — Vol. 41 , iss. Problema baza de date . — P. D177–187 . — ISSN 1362-4962 . doi : 10.1093 / nar/gks1060 . Arhivat din original pe 5 mai 2017.
  52. Alexander Lachmann, Huilei Xu, Jayanth Krishnan, Seth I. Berger, Amin R. Mazloom. ChEA: reglarea factorului de transcripție dedus din integrarea experimentelor ChIP-X la nivel de genom  (engleză)  // Bioinformatică (Oxford, Anglia). — 01-10-2010. — Vol. 26 , iss. 19 . — P. 2438–2444 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btq466 . Arhivat din original pe 5 mai 2017.
  53. Jesse D. Ziebarth, Anindya Bhattacharya, Yan Cui. CTCFBSDB 2.0: o bază de date pentru site-urile de legare a CTCF și organizarea genomului  //  Nucleic Acids Research. — 01-01-2013. — Vol. 41 , iss. Problema baza de date . — P. D188–194 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1165 . Arhivat din original pe 5 mai 2017.
  54. Li Chen, George Wu, Hongkai Ji. hmChIP: o bază de date și un server web pentru explorarea datelor ChIP-seq și ChIP-chip umane și șoarece disponibile public   // Bioinformatică (Oxford, Anglia) . — 15-05-2011. — Vol. 27 , iss. 10 . - P. 1447-1448 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/btr156 . Arhivat din original pe 5 mai 2017.
  55. Ivan V. Kulakovskiy, Ilya E. Vorontsov, Ivan S. Yevshin, Anastasiia V. Soboleva, Artem S. Kasianov. HOCOMOCO: extinderea și îmbunătățirea colecției de modele de site-uri de legare a factorului de transcripție  //  Nucleic Acids Research. — 04-01-2016. — Vol. 44 , iss. D1 . — P. D116–125 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkv1249 . Arhivat din original pe 5 mai 2017.
  56. Albin Sandelin, Wynand Alkema, Pär Engström, Wyeth W. Wasserman, Boris Lenhard. JASPAR: o bază de date cu acces deschis pentru profilele de legare a factorilor de transcripție eucarioți  //  Nucleic Acids Research. - 2004-01-01. — Vol. 32 , iss. Problema baza de date . — P.D91–94 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkh012 . Arhivat din original pe 5 mai 2017.
  57. Mihail Pachkov, Piotr J. Balwierz, Phil Arnold, Evgeniy Ozonov, Erik van Nimwegen. SwissRegulon, o bază de date de adnotări la nivel de genom ale site-urilor de reglementare: actualizări recente  //  Cercetarea acizilor nucleici. — 01-01-2013. — Vol. 41 , iss. Problema baza de date . — P. D214–220 . — ISSN 1362-4962 . - doi : 10.1093/nar/gks1145 . Arhivat din original pe 5 mai 2017.
  58. Bo Qin, Meng Zhou, Ying Ge, Len Taing, Tao Liu. CistromeMap: o bază de cunoștințe și un server web pentru studiile ChIP-Seq și DNase-Seq în șoarece și om   // Bioinformatică (Oxford, Anglia) . — 15-05-2012. — Vol. 28 , iss. 10 . — P. 1411–1412 . — ISSN 1367-4811 . - doi : 10.1093/bioinformatics/bts157 . Arhivat din original pe 5 mai 2017.
  59. Qixuan Wang, Jinyan Huang, Hanfei Sun, Jing Liu, Juan Wang. CR Cistrome: o bază de date ChIP-Seq pentru regulatorii cromatinei și legăturile de modificare a histonelor la om și șoarece  //  Nucleic Acids Research. — 01-01-2014. — Vol. 42 , iss. Problema baza de date . — P. D450–458 . — ISSN 1362-4962 . - doi : 10.1093/nar/gkt1151 . Arhivat din original pe 5 mai 2017.
  60. Christoph D. Schmid, Philipp Bucher. Datele ChIP-Seq dezvăluie arhitectura nucleozomală a promotorilor umani  (engleză)  // Cell. — 30-11-2007. — Vol. 131 , iss. 5 . — P. 831–832; autorul răspunde 832–833 . — ISSN 0092-8674 . - doi : 10.1016/j.cell.2007.11.017 . Arhivat din original pe 5 mai 2017.
  61. Wei Niu, Zhi John Lu, Mei Zhong, Mihail Sarov, John I. Murray. Diverse caracteristici de legare a factorului de transcripție dezvăluite de ChIP-seq la nivelul întregului genom în C. elegans  //  Genome Research. — 2011-02-01. — Vol. 21 , iss. 2 . — P. 245–254 . — ISSN 1549-5469 . - doi : 10.1101/gr.114587.110 . Arhivat din original pe 5 mai 2017.
  62. Xiong Ji, Daniel B. Dadon, Brian J. Abraham, Tong Ihn Lee, Rudolf Jaenisch. Profilul proteomic al cromatinei dezvăluie noi proteine ​​asociate cu regiuni genomice marcate cu histonă  // Proceedings of the National Academy of Sciences. — 09-03-2015. - S. 201502971 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.1502971112 .
  63. Huihuang Yan, Shulan Tian, ​​​​Susan L Slager, Zhifu Sun. ChIP-seq în studierea mecanismelor epigenetice ale bolii și promovarea medicinei de precizie: progrese și direcții viitoare   // Epigenomics . — 2016-9. — Vol. 8 , iss. 9 . — P. 1239–1258 . - ISSN 1750-192X 1750-1911, 1750-192X . - doi : 10.2217/epi-2016-0053 .
  64. Henriette O'Geen, Lorigail Echipare, Peggy J. Farnham. Utilizarea tehnologiei ChIP-Seq pentru a genera profiluri de înaltă rezoluție ale modificărilor histonelor  // Metode în biologie moleculară (Clifton, NJ). - 2011. - T. 791 . — S. 265–286 . — ISSN 1064-3745 . - doi : 10.1007/978-1-61779-316-5_20 .
  65. Tarjei S. Mikkelsen, Manching Ku, David B. Jaffe, Biju Issac, Erez Lieberman. Hărți la nivel de genom ale stării cromatinei în celulele pluripotente și angajate în linie  // Natură. - 2007-08-02. - T. 448 , nr. 7153 . — S. 553–560 . — ISSN 0028-0836 . - doi : 10.1038/nature06008 . Arhivat din original pe 22 mai 2016.
  66. Douglas F. Browning, Stephen JW Busby. Reglarea inițierii transcripției bacteriene  // Nature Reviews Microbiology. - 2004-01. - T. 2 , nr. 1 . — p. 57–65 . - ISSN 1740-1534 1740-1526, 1740-1534 . - doi : 10.1038/nrmicro787 .
  67. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identificarea de înaltă rezoluție a site-urilor de legare a factorului de transcripție din PET și SET ChIP-Seq Data  // PLoS Computational Biology. — 17.10.2013. - T. 9 , nr. 10 . — S. e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  68. Antonio LC Gomes, Thomas Abeel, Matthew Peterson, Elham Azizi, Anna Lyubetskaya. Decodificarea ChIP-seq cu un semnal de dublă legare rafinează vârfurile de legare la un singur nucleotide și prezice interacțiunea de cooperare  //  Genome Research. — 2014-10. — Vol. 24 , iss. 10 . - P. 1686-1697 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.161711.113 .
  69. Yuchun Guo, Shaun Mahony, David K. Gifford. Găsirea evenimentelor de legare la nivelul genomului de înaltă rezoluție și descoperirea motivelor relevă constrângerile de legare spațială a factorului de transcripție  //  Biologie computațională PLoS / Stein Aerts. — 09-08-2012. — Vol. 8 , iss. 8 . — P.e1002638 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1002638 .
  70. Xuekui Zhang, Gordon Robertson, Martin Krzywinski, Kaida Ning, Arnaud Droit. PICS: Inferență probabilistică pentru ChIP-seq  (engleză)  // Biometrie. — 2011-3. — Vol. 67 , iss. 1 . — P. 151–163 . - doi : 10.1111/j.1541-0420.2010.01441.x .
  71. Dongjun Chung, Dan Park, Kevin Myers, Jeffrey Grass, Patricia Kiley. dPeak: Identificarea de înaltă rezoluție a site-urilor de legare a factorului de transcripție din PET și SET ChIP-Seq Data  //  PLoS Computational Biology / Roderic Guigo. — 17.10.2013. — Vol. 9 , iss. 10 . — P.e1003246 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1003246 .
  72. Jason Ernst, Manolis Kellis. Descoperirea și caracterizarea stărilor cromatinei pentru adnotarea sistematică a genomului uman  // Nature Biotechnology. — 25-07-2010. - T. 28 , nr. 8 . — S. 817–825 . - ISSN 1546-1696 1087-0156, 1546-1696 . - doi : 10.1038/nbt.1662 .
  73. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Cartografierea și analiza dinamicii stării cromatinei în nouă tipuri de celule umane  // Nature. — 23-03-2011. - T. 473 , nr. 7345 . — p. 43–49 . — ISSN 1476-4687 0028-0836, 1476-4687 . - doi : 10.1038/nature09906 .
  74. Shirley Pepke, Barbara Wold, Ali Mortazavi. Calcul pentru studii ChIP-seq și ARN-seq  // Nature Methods. — 2009-11. - T. 6 , nr. 11 . — S. S22–S32 . - ISSN 1548-7105 1548-7091, 1548-7105 . - doi : 10.1038/nmeth.1371 .