Analiza rețelelor de co-expresie genică ponderată

Analiza rețelei de coexpresie genetică ponderată (WGCNA ) ,  cunoscută și sub denumirea de analiză a rețelei de corelație ponderată , este o metodă de extragere a datelor bazată pe corelații perechi între variabile [2] . Metoda poate fi utilizată pentru a analiza o gamă largă de seturi de date multivariate, dar este utilizată cel mai pe scară largă în genomică [3] . Metoda face posibilă determinarea modulelor (clustere de gene co -exprimate), hub-uri inter-module și noduri de rețea în ceea ce privește apartenența la un modul, studierea relațiilor dintre modulele co-exprimate și compararea topologiilor diferitelor rețele. WGCNA poate fi utilizat ca metodă de reducere a dimensionalității datelor (asociată cu analiza factorială indirectă ), ca metodă de grupare , ca metodă de selecție a caracteristicilor (de exemplu, pentru screening-ul genelor) [3] .  

Istorie

Metoda WGCNA a fost dezvoltată de profesorul Steve Horvath în special Peter Langfelder, Bin Zhangomi și Jun Dong) și publicată în 2005. O mare parte a metodei a apărut în cursul cercetării aplicate. În special, rețele de corelație ponderată au fost dezvoltate în discuții de colaborare cu cercetătorii de cancer Paul Michel, Stanley F. Nelson și neurologii Daniel Geschwind și Michael Oldham [2] . În 2008, a fost publicată o implementare software a algoritmului [1] .

Algoritm de operare

Construirea unei rețele primare

Datele inițiale sunt o matrice a expresiei genelor în mai multe probe , unde  este numărul de gene,  este numărul de probe. Pentru a construi o rețea de co-expresie pentru fiecare pereche de gene , se calculează parametrul de similaritate, , care trebuie să se afle în . implicit la valoarea absolută a coeficientului de corelație al lui Pearson

,

unde profilurile de co-expresie ale genelor și constau în expresia genelor i și j într-un set de mostre. Pentru a obține o mai mare robustețe față de valori aberante, poate fi utilizat un coeficient de , iar pentru a păstra semnul coeficientului, poate fi utilizată o transformare simplă de corelație:corelație „trunchiat” Rezultă matricea de similaritate [2] .

Filtrarea marginilor în funcție de greutate folosind criterii fără scară

Pentru a calcula matricea de adiacență a rețelei din matricea de similaritate, aveți nevoie de o funcție de adiacență care mapează un interval la un interval . Funcția tradițională de adiacență este funcția signum cu prag dur :

O astfel de filtrare strictă de margine este utilizată atunci când se construiesc rețele neponderate, iar rezultatul este în concordanță cu o înțelegere intuitivă a conceptului de rețea (conectivitatea unui nod este aceeași cu numărul de vecini asociat cu acesta). Cu toate acestea, această abordare duce adesea la o pierdere de informații: de exemplu, dacă setați , atunci nu va exista nicio conexiune între nodurile cu un parametru de similaritate de 0,79. Astfel, astfel de rețele sunt foarte sensibile la alegerea hiperparametrului [2] .

Rețelele ponderate nu au acest dezavantaj. Algoritmul WGCNA folosește o funcție de putere ca funcție de adiacență :

Valoarea este determinată folosind criteriul de rețea fără scară topologică pentru valori întregi . Pentru diferite valori întregi , se construiește un model liniar al dependenței logaritmului proporției vârfurilor rețelei cu un grad de logaritmul gradului . Se alege cea mai mică valoare , la care coeficientul de determinare al modelului liniar corespunzător depășește 0,8 [2] .

Matricea de adiacență „soft” permite doar clasarea nodurilor rețelei în funcție de puterea conexiunii lor cu nodul în cauză. Dacă este necesar să se determine o listă limitată de vecini, se introduce un prag de puterea conexiunii. Această metodă de filtrare „soft” a marginilor rețelei se numește ponderare a rețelei [2] .

Netezirea ponderată a rețelei

Pentru a determina modulele rețelei și pentru a elimina zgomotul, se efectuează operația de netezire a rețelei. În primul rând, se calculează matricea de similaritate topologică (măsura de suprapunere topologică ) :

,

unde  este un element al matricei de adiacentă, , .

este egal cu , dacă nodul cu mai puțini vecini este conectat la nodul cu mai mulți vecini și toți vecinii nodului sunt vecini ai nodului . este egal cu , dacă nodurile și nu sunt conectate și nu au vecini comuni. De când , atunci și . Asemănarea topologică a două noduri reflectă intraconectivitatea lor relativă [2] .

Pe baza matricei de similaritate topologică, se construiește o matrice de diferențe :

.

Modulele de rețea sunt alocate conform matricei de disimilaritate [2] .

Gruparea ierarhică și alocarea modulelor

Gruparea ierarhică a matricei de disimilaritate [2] este utilizată pentru a selecta modulele de rețea . Modulele genelor sunt ramuri ale dendrogramei rezultate . Pentru a izola modulele, ramurile dendrogramei sunt tăiate. Metoda de tăiere statică, care extrage ramuri sub un anumit prag ca un cluster separat, produce module care sunt ușor de distins vizual, dar nu îndeplinesc definiția strictă a conceptului de „modul” [1] .

WGCNA utilizează metoda Dynamic Tree Cut [4] , care este un proces iterativ adaptiv de împărțire și combinare a modulelor și se oprește atunci când numărul de module rămâne stabil. Setul inițial de module sunt module mari definite într-un mod static. Apoi, există o partițiune recursivă în submodule bazată pe prezența unui model de fluctuații în lungimea ramurilor în cadrul unui modul sursă. Modulele mici sunt combinate cu cele învecinate pentru a evita fragmentarea excesivă [2] .

Versiunile ulterioare ale algoritmului folosesc o abordare hibridă dinamică , care permite detectarea cu succes a valorii aberante în fiecare cluster [2] . Ramurile care îndeplinesc următoarele criterii sunt folosite ca început de module:

După determinarea unor astfel de module rudimentare, toate celelalte obiecte care nu au fost incluse în module la prima etapă, dacă este posibil, sunt incluse în modulele formate prin metoda celor mai apropiate medoide . Este posibil ca obiectele din același modul final să nu fie situate unul lângă celălalt pe dendrogramă, dar această inconsecvență este înșelătoare și rezultă din limitările afișării datelor reale sub forma unei dendrograme [5] .

Validarea modulului

Pentru validarea modulelor, analiza bootstrap este utilizată pe mostre incomplete de eșantioane [2] . Numai acele module care au fost găsite într-un număr mare de replici bootstrap [6] sunt supuse analizei ulterioare .

Interpretarea rezultatelor

Generalizarea profilului de expresie genetică a modulului

Modulul de coexpresie este reprezentat de propria sa genă ( ing. eigengen ) , care este vectorul singular drept corespunzător celei mai mari valori singulare drepte din descompunerea singulară a matricei de expresie genică a acestui modul [7] .

Corelarea modulelor cu caracteristici externe

Pentru a determina semnificația influenței expresiei unei gene asupra expresiei unei trăsături , se poate folosi modulul coeficientului de corelație sau al valorii p a analizei de corelație sau regresie corespunzătoare . Pentru a determina semnificația influenței expresiei genei modulului , sunt utilizate diferite valori:

Cu cât valoarea semnificației este mai mare, cu atât gena sau modulul de genă dat este mai semnificativ pentru manifestarea acestei trăsături [2] .

Interacțiunea modulelor

Pentru a evalua interacțiunea (co-expresia) modulelor, atât corelațiile perechi între propriile gene ale modulelor, cât și construirea unei meta-rețele bazate pe matricea de co-expresie a genelor proprii ale modulelor și izolarea meta-modulelor în sunt utilizate aceste meta-rețele, inclusiv utilizarea informațiilor despre manifestarea trăsăturilor pentru determinarea importanței modulelor [1] .

Izolarea genelor importante

Unul dintre punctele cheie în analiza rețelei construite este selecția nodurilor centrale (hub-uri) - gene care sunt foarte corelate cu multe alte gene de rețea. Metrici de conectivitate a două noduri: standard și topologică  — pot fi calculate atât pe întreaga rețea (conectivitate la rețea completă, ing. conectivitate la rețea întreagă ), cât și numai pentru genele aceluiași modul (conectivitate intramodulară, conectivitate intramodulară ing . ). Rețeaua completă standard și topologică și conectivitatea intramodală sunt notate ca , , și , respectiv.

Utilizarea conectivității intra-modul (normalizată la valoarea maximă a conectivității într-un modul) este de preferat conectivitate de rețea completă atunci când se compară gene din module diferite, deoarece o genă puternic conectată dintr-un modul mic, dar important poate avea o valoare mult mai mică de conectivitate completă la rețea în comparație cu o genă care are un grad mediu de conectivitate de la un modul mare, dar nu foarte important.

La rândul său, conectivitatea intra-modul a unei gene reflectă cât de conectată sau co-exprimată este gena în cauză în relație cu genele acestui modul. Această măsurătoare poate fi interpretată ca o măsură a apartenenței la modul.

Există, de asemenea, metrici și . O valoare medie ridicată pentru genele modulului (chiar mai mare decât valoarea medie ) poate însemna că acest modul este nucleul rețelei și important din punct de vedere biologic în condițiile studiate. O valoare mare , dimpotrivă, înseamnă că conectivitatea totală este mai mare decât conectivitatea din cadrul modulului, adică genele care alcătuiesc acest modul sunt stabile și își schimbă ușor expresia în condițiile studiate [1] .

Măsura ponderată a apartenenței la un modul

O măsură binară a apartenenței la modul poate să nu fie cea mai potrivită măsură pentru unele aplicații, astfel încât o măsură continuă a apartenenței la modul poate fi utilizată ca măsură a apartenenței unei gene la un modul . Ca o astfel de măsură, se poate folosi fie o măsură de conectivitate bazată pe vectorii proprii ai modulelor, . Acesta din urmă este definit ca corelația dintre gena și gena proprie a modulului : . O valoare mare (aproape de sau ) indică o relație puternică între genă și modul , o valoare apropiată de indică faptul că gena nu aparține modulului . Metrici și sunt interconectate: hub-urile intramodale tind să aibă o valoare ridicată pentru modulul corespunzător [1] .

Comparația rețelelor de corelație ponderate și neponderate

O rețea de corelație ponderată poate fi considerată ca un caz special de rețea ponderată , o rețea de dependență sau o rețea de corelare [2] . Analiza rețelelor de corelație ponderată are următoarele avantaje față de rețelele neponderate:

Aplicație

WGCNA este utilizat pe scară largă pentru a analiza datele despre expresia genelor, de exemplu, pentru a căuta hub-uri intermodulare [12] [13] .

Această tehnică este adesea folosită ca pas de reducere a dimensionalității datelor atunci când este aplicată geneticii sistemelor, unde modulele sunt reprezentate de autogene [14] [15] . Genele proprii ale modulelor pot fi folosite pentru a calcula corelații cu datele experimentale [1] .

WGCNA este utilizat pe scară largă în neuroștiință [16] [17] și pentru analiza datelor genomice, inclusiv microarrays [18] , date ARN-Seq cu o singură celulă [19] [20] date de metilare ADN , [21] miARN , numărarea peptidelor [ 22] și date de microbiotă ( secvențierea genei ARNr 16S ) [23] . Alte aplicații includ datele imagistice ale creierului , cum ar fi datele RMN funcționale [24] , analiza datelor despre cancer , cum ar fi subclasificarea gliomelor și biomarkerii lor asociați [25] și datele de performanță a cililor [26] .

WGCNA poate fi utilizat pentru meta-analiză a datelor obținute din diferite surse [27] [28] .

Implementarea software a algoritmului

Pachetul software R

Pachetul software WGCNA R [1] oferă funcții pentru efectuarea tuturor elementelor de analiză ponderată a rețelei (construcția modulelor, selecția genelor hub, statisticile conservatorismului modulelor, analiza rețelei diferențiale, statisticile rețelei). Pachetul WGCNA este disponibil de la CRAN , depozitul standard de pachete suplimentare pentru R, dar WGCNA necesită pachete disponibile din depozitul Bioconductor [29] pentru a funcționa . Pachetului este dedicat un site separat, unde sunt publicate scurte tutoriale cu o demonstrație a capabilităților pachetului [29] , și există și un blog al unuia dintre autorii metodei, în care articole tematice, manuale și știri ale pachetele sunt publicate [30] .

Exportarea rezultatelor pentru analiză în programele copil

Pachetul conține funcții pentru vizualizarea rețelelor rezultate în VisANT și Cytoscape [31] . Pachetul anRichment a fost de asemenea dezvoltat pentru adnotarea funcțională extinsă a genelor în modulele alocate de WGCNA [32] .

iterativWGCNA

Există o extensie la pachetul de bază R numită iterativeWGCNA implementată în Python . Extensia face posibilă îmbunătățirea stabilității modulelor detectate și reducerea pierderii de informații. Pentru a face acest lucru, genele care nu se încadrează în module, precum și genele cu o valoare slabă a conectivității la modulele lor, sunt din nou supuse analizei WGCNA și modulele sunt redefinite pentru acestea [33] .

Analiza datelor la nivel de genom

Analiza rețelelor de co-expresie pentru seturi de date cu un număr mare de probe la scară la nivel de genom este o sarcină dificilă din punct de vedere computațional, care necesită o cantitate mare de RAM și timp de calcul. Datorită faptului că în procesul de construire a unei rețele se calculează coeficientul de corelație între noduri, atunci analiza unei rețele cu noduri necesită RAM și timp de calcul [1] . Există două strategii pentru a rezolva această problemă [34] .

Analiza unui set limitat de gene

Este posibil să se reducă numărul de gene analizate la 4000-5000, care au cea mai mare valoare a oricărui parametru: valoarea varianței profilului de expresie a genei în matricea de date [35] [36] , valoarea p a testul nivelului de expresie genică între diferite grupuri de probe [37] , proporția de probe în care este detectată expresia genică [37] și altele. Principalele dezavantaje ale acestei abordări sunt pierderea informațiilor despre genele rămase, prejudecățile incorectă a genelor în funcție de funcție 38] .

Metode euristice pentru determinarea modulelor

O abordare este de a extrage mai întâi module dintr-un subeșantion de gene și apoi de a adăuga genele rămase la modulele selectate pe baza unei metrici : pentru fiecare genă, se calculează cu care dintre module se corelează cel mai mult. Dar dacă o anumită genă nu se corelează cu niciun modul peste un anumit prag, atunci nu este inclusă în niciun modul [34] .

O altă abordare este aceea că, în stadiul inițial, genele sunt împărțite în blocuri de o dimensiune predeterminată folosind metoda k-nearest neighbors , iar alocarea ulterioară a modulelor este efectuată în cadrul acestor blocuri. Modulele rezultate fuzionează și se corelează între ele în funcție de corelarea propriilor gene. Această abordare este implementată în pachetul WGCNA și necesită RAM și calcule pentru blocuri de dimensiune [1] .

Note

  1. 1 2 3 4 5 6 7 8 9 10 11 Peter Langfelder, Steve Horvath. WGCNA: un pachet R pentru analiza rețelei de corelație ponderată  // BMC bioinformatică. — 29-12-2008. - T. 9 . - S. 559 . — ISSN 1471-2105 . - doi : 10.1186/1471-2105-9-559 . Arhivat 28 aprilie 2020.
  2. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Zhang B., Horvath S. A General Framework for Weighted Gene Co-Expression Network Analysis.  (engleză)  // Aplicații statistice în genetică și biologie moleculară. — 2005-08-12. — Vol. 4 , iss. 1 . - doi : 10.2202/1544-6115.1128 . Arhivat din original pe 28 septembrie 2020.
  3. 1 2 3 Steve Horvath. Analiza ponderată a rețelei: aplicații în genomica și biologia sistemelor . — New York: Springer-Verlag, 2011. — ISBN 978-1-4419-8818-8 . Arhivat pe 18 septembrie 2020 la Wayback Machine
  4. 1 2 Langfelder P., Zhang B., Horvath S. Definirea clusterelor dintr-un arbore de cluster ierarhic: biblioteca Dynamic Tree Cut pentru R.   // Bioinformatica . — 16-11-2007. — Vol. 24 , iss. 5 . - P. 719-720 . - doi : 10.1093/bioinformatics/btm563 . Arhivat din original pe 11 februarie 2016.
  5. Peter Langfelder. De ce modulele WGCNA nu sunt întotdeauna de acord cu dendrograma?  (engleză) . Perspective dintr-un miliard de corelații (31 decembrie 2018). Preluat la 19 aprilie 2020. Arhivat din original la 27 septembrie 2020.
  6. Peter Langfelder și Steve Horvath. Exemplu de analiză a stabilității modulului . Funcții rapide pentru corelare și clustering ierarhic Exemple de cod R (15 octombrie 2014).
  7. 1 2 3 Horvath S., Dong J. Geometric Interpretation of Gene Coexpression Network Analysis.  (engleză)  // PLoS Comput Biol. — 15-08-2008. — Vol. 4 , iss. 8 . - doi : 10.1371/journal.pcbi.1000117 . Arhivat din original la 30 decembrie 2014.
  8. Peter Langfelder și Steve Horvath. [ https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/FemaleLiver-03-relateModsToExt.pdf Tutorial pentru pachetul WGCNA pentru R: I. Analiza de rețea a datelor despre expresia ficatului la șoareci femele 3 .Relaţionarea modulelor cu informaţiile externe şi identificarea genelor importante] . Tutoriale pentru pachetul WGCNA (25-11-2014). Preluat la 19 aprilie 2020. Arhivat din original la 17 ianuarie 2021.
  9. Peter Langfelder, Steve Horvath. Rețele proprii pentru studierea relațiilor dintre modulele de co-expresie  // BMC Systems Biology. — 21.11.2007. - T. 1 , nr. 1 . — ISSN 1752-0509 . - doi : 10.1186/1752-0509-1-54 .
  10. Peter Langfelder, Rui Luo, Michael C. Oldham, Steve Horvath. Modulul meu de rețea este păstrat și reproductibil?  // Biologie computațională PLoS. — 20.01.2011. - T. 7 , nr. 1 . — S. e1001057 . — ISSN 1553-7358 . - doi : 10.1371/journal.pcbi.1001057 .
  11. 1 2 John Michael Ranola, Peter Langfelder, Kenneth Lange, Steve Horvath. Aproximare bazată pe cluster și propensiune a unei rețele  // BMC Systems Biology. — 14-03-2013. - T. 7 , nr. 1 . - S. 21 . — ISSN 1752-0509 . - doi : 10.1186/1752-0509-7-21 .
  12. Peter Langfelder, Paul S. Mischel, Steve Horvath. Când este selecția genelor Hub mai bună decât metaanaliza standard?  (Engleză)  // PLOS ONE. — 17-04-2013. — Vol. 8 , iss. 4 . — P.e61505 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0061505 . Arhivat din original pe 23 martie 2022.
  13. S. Horvath, B. Zhang, M. Carlson, K.V. Lu, S. Zhu. Analiza rețelelor de semnalizare oncogene în glioblastom identifică ASPM ca o țintă moleculară  // Proceedings of the National Academy of Sciences. — 07-11-2006. - T. 103 , nr. 46 . — S. 17402–17407 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.0608396103 .
  14. Yanqing Chen, Jun Zhu, Pek Yee Lum, Xia Yang, Shirly Pinto. Variațiile ADN-ului elucidează rețelele moleculare care provoacă boli   // Natura . — 2008-03. — Vol. 452 , iss. 7186 . — P. 429–435 . — ISSN 1476-4687 . - doi : 10.1038/nature06757 . Arhivat 25 mai 2021.
  15. Christopher L. Plaisier, Steve Horvath, Adriana Huertas-Vazquez, Ivette Cruz-Bautista, Miguel F. Herrera. O abordare genetică a sistemelor implică USF1, FADS3 și alte gene candidate cauzale pentru hiperlipidemia familială combinată  //  Genetica PLOS. — 2009-11-09. — Vol. 5 , iss. 9 . — P.e1000642 . — ISSN 1553-7404 . - doi : 10.1371/journal.pgen.1000642 . Arhivat din original pe 23 aprilie 2022.
  16. Irina Voineagu, Xinchen Wang, Patrick Johnston, Jennifer K. Lowe, Yuan Tian. Analiza transcriptomică a creierului autist dezvăluie o patologie moleculară convergentă   // Nature . — 2011-06. — Vol. 474 , iss. 7351 . - P. 380-384 . — ISSN 1476-4687 . - doi : 10.1038/nature10110 . Arhivat din original pe 6 septembrie 2019.
  17. Michael J. Hawrylycz, Ed S. Lein, Angela L. Guillozet-Bongaarts, Elaine H. Shen, Lydia Ng. Un atlas cuprinzător din punct de vedere anatomic al transcriptomului creierului uman adult  (engleză)  // Natură. — 2012-09. — Vol. 489 , iss. 7416 . — P. 391–399 . — ISSN 1476-4687 . - doi : 10.1038/nature11405 . Arhivat din original pe 11 decembrie 2019.
  18. Haja N. Kadarmideen, Nathan S. Watson-Haigh, Nicholas M. Andronicos. Biologia sistemelor de rezistență a paraziților intestinali ovini: module genetice ale bolii și biomarkeri  (engleză)  // Molecular BioSystems. — 2011-01-01. — Vol. 7 , iss. 1 . — P. 235–246 . — ISSN 1742-2051 . - doi : 10.1039/C0MB00190B . Arhivat din original pe 15 aprilie 2019.
  19. Lisette J.A. Kogelman, Susanna Cirera, Daria V. Zhernakova, Merete Fredholm, Lude Franke. Identificarea rețelelor de gene de co-expresie, a genelor de reglare și a căilor pentru obezitate bazate pe secvențierea ARN a țesutului adipos într-un model porcin  // BMC Medical Genomics. — 30.09.2014. - T. 7 , nr. 1 . - S. 57 . — ISSN 1755-8794 . - doi : 10.1186/1755-8794-7-57 .
  20. Zhigang Xue, Kevin Huang, Chaochao Cai, Lingbo Cai, Chun-yan Jiang. Programe genetice în embrionii timpurii umani și de șoarece, dezvăluite prin secvențierea ARN-ului unicelular   // Nature . — 2013-08. — Vol. 500 , iss. 7464 . — P. 593–597 . — ISSN 1476-4687 . - doi : 10.1038/nature12364 . Arhivat din original pe 2 decembrie 2019.
  21. Steve Horvath, Yafeng Zhang, Peter Langfelder, René S. Kahn, Marco PM Boks. Efectele îmbătrânirii asupra modulelor de metilare a ADN-ului în creierul uman și țesutul sanguin  // Biologia genomului. — 03-10-2012. - T. 13 , nr. 10 . - S. R97 . — ISSN 1474-760X . - doi : 10.1186/gb-2012-13-10-r97 .
  22. Dyna I. Shirasaki, Erin R. Greiner, Ismael Al-Ramahi, Michelle Gray, Pinmanee Boontheung. Organizarea rețelei a interatomului proteomic huntingtin în creierul mamiferelor  // Neuron. — 12.07.2012. - T. 75 , nr. 1 . — p. 41–57 . — ISSN 1097-4199 . - doi : 10.1016/j.neuron.2012.05.024 . Arhivat din original pe 18 decembrie 2012.
  23. Maomeng Tong, Xiaoxiao Li, Laura Wegener Parfrey, Bennett Roth, Andrew Ippoliti. O organizare modulară a microbiotei mucoasei intestinale umane și asocierea acesteia cu boala inflamatorie intestinală  // PLoS ONE. — 19.11.2013. - T. 8 , nr. 11 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0080702 .
  24. Jeanette A Mumford, Steve Horvath, Michael C. Oldham, Peter Langfelder, Daniel H. Geschwind. Detectarea modulelor de rețea în serii de timp fMRI: O abordare ponderată de analiză a rețelei  // NeuroImage. — 01-10-2010. - T. 52 , nr. 4 . - S. 1465-1476 . — ISSN 1053-8119 . - doi : 10.1016/j.neuroimage.2010.05.047 .
  25. AE Ivliev, PAC 't Hoen, MG Sergeeva. Analiza rețelei de coexpresie identifică module transcripționale legate de diferențierea proastrocitară și semnalizarea germinativă în gliom  //  Cercetarea cancerului. — 15.12.2010. — Vol. 70 , iss. 24 . — P. 10060–10070 . — ISSN 1538-7445 0008-5472, 1538-7445 . - doi : 10.1158/0008-5472.CAN-10-2465 .
  26. Alexander E. Ivliev, Peter AC 't Hoen, Willeke MC van Roon-Mom, Dorien JM Peters, Marina G. Sergeeva. Explorarea transcriptomului celulelor ciliate folosind disecția in silico a țesuturilor umane  //  PLOS ONE. — 25-04-2012. — Vol. 7 , iss. 4 . — P.e35618 . — ISSN 1932-6203 . - doi : 10.1371/journal.pone.0035618 . Arhivat din original pe 17 aprilie 2022.
  27. Jeremy A. Miller, Steve Horvath, Daniel H. Geschwind. Divergența transcriptomului creierului uman și al șoarecelui evidențiază căile bolii Alzheimer  //  Proceedings of the National Academy of Sciences. — 13.07.2010. — Vol. 107 , iss. 28 . — P. 12698–12703 . - ISSN 1091-6490 0027-8424, 1091-6490 . - doi : 10.1073/pnas.0914257107 .
  28. Meta-analize ale datelor din două (sau mai multe) seturi de date microarray. . horvath.genetics.ucla.edu. Preluat la 19 aprilie 2020. Arhivat din original la 22 iulie 2020.
  29. ↑ 1 2 WGCNA: Pachetul R pentru efectuarea analizei rețelei de co-expresie genetică ponderată . horvath.genetics.ucla.edu. Preluat la 21 aprilie 2020. Arhivat din original la 23 octombrie 2020.
  30. Perspective dintr-un miliard de  corelații . Perspective dintr-un miliard de corelații. Preluat la 21 aprilie 2020. Arhivat din original la 10 august 2020.
  31. Peter Langfelder și Steve Horvath. [ https://horvath.genetics.ucla.edu/html/CoexpressionNetwork/Rpackages/WGCNA/Tutorials/FemaleLiver-06-ExportNetwork.pdf Tutorial pentru pachetul WGCNA pentru R: I. Analiza de rețea a datelor privind expresia ficatului la șoareci femele 6 .Exportul unei rețele de gene către software extern de vizualizare] . Tutoriale pentru pachetul WGCNA (25 noiembrie 2014).
  32. Peter Langfelder. Analiza îmbogățirii funcționale prin pachetul R anRichment  . Perspective dintr-un miliard de corelații (25 noiembrie 2018). Preluat la 21 aprilie 2020. Arhivat din original la 4 august 2020.
  33. Emily Greenfest-Allen, Jean-Philippe Cartailler, Mark A. Magnuson, Christian J. Stoeckert. iterativeWGCNA: rafinare iterativă pentru a îmbunătăți detectarea modulelor din rețelele de co-expresie   WGCNA // bioRxiv . — 14-12-2017. — P. 234062 . - doi : 10.1101/234062 . Arhivat din original pe 9 aprilie 2019.
  34. ↑ 1 2 Ivliev, Alexandru Evghenievici. Analiza rețelelor de gene de co-expresie pentru studiul transcriptomului tumorilor cerebrale și predicția funcțiilor genelor  (rusă)  // Locul de protecție: Inst. A.A. Kharkevich RAS: disertație... candidat la științe biologice: 03.01.09. — 2011.
  35. Angela P. Presson, Eric M. Sobel, Jeanette C. Papp, Charlyn J. Suarez, Toni Whistler. Analiza rețelei de co-expresie genetică ponderată integrată cu o aplicație la sindromul oboselii cronice  //  BMC Systems Biology. — 06-11-2008. — Vol. 2 , iss. 1 . — P. 95 . — ISSN 1752-0509 . - doi : 10.1186/1752-0509-2-95 .
  36. Anastasia Murat, Eugenia Migliavacca, Thierry Gorlia, Wanyu L. Lambiv, Tal Shay. Semnătura de „auto-reînnoire” legată de celulele stem și expresia ridicată a receptorului factorului de creștere epidermic asociată cu rezistența la chimioradioterapie concomitentă în glioblastom  //  Journal of Clinical Oncology. — 20.06.2008. - T. 26 , nr. 18 . — S. 3015–24 . — ISSN 0732-183X . - doi : 10.1200/JCO.2007.15.7164 . Arhivat din original pe 4 august 2020.
  37. 1 2 Xia Yang, Eric E. Schadt, Susanna Wang, Hui Wang, Arthur P. Arnold. Expresia specifică țesutului și reglarea genelor dimorfice sexual la șoareci  (engleză)  // Cercetarea genomului. - 2006-08-01. — Vol. 16 , iss. 8 . — P. 995–1004 . — ISSN 1549-5469 1088-9051, 1549-5469 . - doi : 10.1101/gr.5217506 . Arhivat din original pe 18 noiembrie 2019.
  38. Haiyan Hu, Xiaoman Li. Reglarea transcripțională în genele proteinelor ribozomale eucariote  (engleză)  // Genomics. — 2007-10-01. — Vol. 90 , iss. 4 . — P. 421–423 . — ISSN 0888-7543 . - doi : 10.1016/j.ygeno.2007.07.003 .

Link -uri