Chimioinformatica

Chimioinformatica ( informatica chimică , informatica moleculară ) este aplicarea metodelor informatice pentru a rezolva probleme chimice.

Domenii de aplicare ale chimioinformaticii: predicția proprietăților fizico-chimice ale compușilor chimici (în special, lipofilitatea , solubilitatea în apă), proprietățile materialelor, activitatea toxicologică și biologică, ADME/T, proprietățile ecotoxicologice, dezvoltarea de noi medicamente și materiale.

Definiţia cheminformatics

Termenul de chimioinformatică a fost inventat de F.C. Brown [1] [2] în 1998:

Chimioinformatica înseamnă partajarea resurselor informaționale pentru a transforma datele în informații și informațiile în cunoștințe pentru a lua mai rapid cele mai bune decizii în căutarea compușilor de vârf în dezvoltarea medicamentelor și optimizarea acestora.

Mai târziu această definiție a fost extinsă de J. Gasteiger [3] [4] :

Chimioinformatica este aplicarea metodelor informatice pentru a rezolva probleme chimice.

G. Paris de la Novartis a dat următoarea definiție a chimioinformaticii [5] :

Chimioinformatica este o disciplină științifică care acoperă proiectarea, crearea, organizarea, managementul, regăsirea, analiza, diseminarea, vizualizarea și utilizarea informațiilor chimice.

Conform definiției date de A. Warnek și I. Baskin [6] [7] :

Chimioinformatica este o ramură a chimiei teoretice bazată pe propriul model molecular; Spre deosebire de chimia cuantică, în care moleculele sunt reprezentate ca ansambluri de electroni și nuclee, și modelarea moleculară bazată pe forță, care se ocupă de „atomi” și „legături” clasice, chimioinformatica consideră moleculele ca obiecte în spațiul chimic.

Definiția cea mai completă și detaliată a chimioinformaticii ca disciplină științifică este conținută în Declarația Obernay [8] :

Chimioinformatica este o disciplină științifică care a apărut în ultimii 40 de ani în zona de graniță dintre chimie și matematica computațională. S-a realizat că în multe domenii ale chimiei, cantitatea mare de informații acumulate în cursul cercetărilor chimice nu putea fi procesată și analizată decât cu ajutorul computerelor. Mai mult, multe dintre problemele din chimie sunt atât de complexe încât sunt necesare noi abordări bazate pe aplicarea metodelor informatice pentru a le rezolva. Pe baza acesteia, s-au dezvoltat metode pentru construirea de baze de date despre compuși și reacții chimice, pentru prezicerea proprietăților fizice, chimice și biologice ale compușilor și materialelor, pentru căutarea de noi medicamente, analiza informațiilor spectrale, pentru prezicerea cursului reacțiilor chimice și planificare. sinteza organica.

Chimioinformatică și alte științe

Bazele

Chimioinformatica se află la intersecția dintre chimie și informatică . Chimioinformatica se bazează pe ideea unui spațiu chimic - totalitatea tuturor obiectelor chimice disponibile (compuși chimici, reacții, amestecuri, soluții, sisteme catalitice, materiale etc.). O trăsătură distinctivă a chimioinformaticii este că, în cadrul acesteia, predicția proprietăților obiectelor chimice se realizează prin transferul (interpolare) valorilor cunoscute ale proprietăților de la obiecte chimice similare. În cele mai multe cazuri, obiectele chimice pot fi reprezentate ca grafice moleculare și, prin urmare , metodele teoriei grafurilor sunt utilizate pe scară largă în chimioinformatică. Abordarea tradițională a procesării informațiilor chimice este însă de a mapa spațiul chimic pe un spațiu de descriptor format din vectori de descriptori moleculari calculați pentru fiecare obiect chimic - caracteristici numerice care descriu obiectele chimice (în special, grafice moleculare ). Acest lucru face posibilă aplicarea metodelor de statistică matematică și de învățare automată (inclusiv data mining ) pentru a lucra cu obiecte chimice.

Fundamentele chimioinformaticii sunt prezentate în manuale [3] [9] [10] [11] [12] [13] , monografii [4] [5] [14] [15] și articole de recenzie [1] [2] [ 7] .

Secțiunile principale

Reprezentarea informatică a informațiilor chimice

În chimioinformatică, pentru reprezentarea internă a structurilor compușilor chimici, se folosesc de obicei grafice moleculare , care pot fi completate, dacă este necesar, cu informații despre coordonatele tridimensionale ale atomilor, precum și despre dinamica modificării acestora în timp. Stocarea pe termen lung a informațiilor chimice și schimbul acesteia între aplicații se realizează folosind fișiere organizate în conformitate cu tipurile de reprezentare externă a informațiilor chimice.

Cel mai simplu tip de reprezentare externă a structurilor compușilor chimici sunt notațiile liniare sub forma unui șir de caractere. Din punct de vedere istoric, notația liniară Wieswesser (WLN) a fost primul tip de notație liniară. Șirurile SMILES sunt în prezent cel mai comun tip de notație liniară . În plus, sunt folosite și notațiile liniare SLN ( Sybyl Line Notation , Tripos, Inc.; conține și posibilitatea de a specifica structuri Markush), SMARTS (extensia SMILES pentru interogări de căutare în baze de date chimice), ROSDAL. Pentru a codifica structurile chimice, IUPAC a propus o notație liniară universală InChI.

Al doilea tip de reprezentare externă a structurilor compușilor chimici și a reacțiilor dintre aceștia se bazează pe codarea directă a matricei de adiacență a graficului molecular. Formatele comune, cum ar fi MOL, SDF și RDF, care sunt în prezent standard pentru schimbul de informații chimice, pot fi considerate modalități de a reprezenta matricea de adiacență a unui grafic molecular într-un fișier text. Același scop este servit de formatele specifice MOL2, HIN, PCM etc., concepute pentru a funcționa cu programe comune de modelare moleculară.

În cele din urmă, al treilea tip de reprezentare externă a structurilor compuse chimice se bazează pe tehnologia XML . Cel mai comun limbaj pentru descrierea informațiilor chimice bazate pe aceste principii este CML.

Reprezentarea informatică a informațiilor chimice este discutată în detaliu în manual [10] .

Crearea și gestionarea bazelor de date de chimie

O caracteristică a managementului bazelor de date în chimie este că oferă următoarele tipuri de căutare, tipice pentru informațiile chimice> [10] :

  1. Căutarea unei structuri chimice identice, controlul duplicatelor
  2. Căutare substructurală
  3. Căutare după asemănarea moleculară
  4. Căutare de farmacofor
  5. Căutare după structuri Markush

Software pentru lucrul cu baze de date ale structurilor chimice (stocare, căutare):

  1. ISIS/gazdă, ISIS/bază ( www.mdli.com )
  2. ChemFinder, ChemOffice ( www.cambridgesoft.com )
  3. JChem ( www.chemaxon.com )
  4. THOR ( www.daylight.com )
  5. MOE ( www.chemcomp.com )
  6. ICM Pro (sub mySQL) ( www.molsoft.com )
  7. CheD (Sergey Trepalin)
  8. UNITATE ( www.tripos.com )
  9. OrChem ( orchem.sourceforge.net )
  10. Bingo ( ggasoftware.com/opensource/bingo )
  11. Pgchem::tigress ( pgfoundry.org/projects/pgchem )

Baze de date publice care conțin informații chimice:

  1. PubChem ( pubchem.ncbi.nlm.nih.gov )
  2. ZINC ( zinc.docking.org )
  3. NCI ( 129.43.27.140/ncidb2 (link descendent  din 13-05-2013 [3441 zile] - istoric ) )
  4. DrugBank ( www.drugbank.ca )
  5. BindingDB ( www.bindingdb.org )
  6. DUD ( dud.docking.org )
  7. ChemSpider ( www.chemspider.com )
  8. ChEMBL ( www.ebi.ac.uk )
  9. ChEBI ( www.ebi.ac.uk )

Bazele de date de chimie sunt discutate în detaliu în manualul [11] .

Predicția proprietăților compușilor și materialelor chimice

Predicția proprietăților compușilor chimici în chimioinformatică se bazează pe utilizarea statisticii matematice și a metodelor de învățare automată pentru a construi modele care să permită prezicerea proprietăților acestora (activitate fizică, chimică, biologică) din descrierea structurilor compușilor chimici. Modelele care fac posibilă prezicerea caracteristicilor cantitative ale activității biologice au primit istoric denumirea în limba engleză Quantitative Structure-Activity Relationship (QSAR). Abrevierea QSAR este adesea interpretată în sens larg pentru a se referi la orice model de structură-proprietate.

Farmacofore și căutare de farmacofor

Un farmacofor  este un set de caracteristici spațiale și electronice necesare pentru a asigura interacțiuni supramoleculare optime cu o țintă biologică specifică care poate provoca (sau bloca) răspunsul său biologic. Căutarea farmacoforului caută o corespondență între descrierea farmacoforului și caracteristicile moleculelor din baza de date care sunt în conformații acceptabile.

Căutare de similaritate moleculară și similaritate moleculară

Asemănarea moleculară (sau asemănarea chimică, similitudinea chimică ) este proximitatea, asemănarea, asemănarea structurilor compușilor chimici. Ca măsură cantitativă a similitudinii moleculare, este adesea considerată o valoare care crește odată cu scăderea distanței dintre compușii chimici din spațiul descriptorului. Căutarea similarității chimice se bazează pe presupunerea că compușii similari au activitate biologică sau catalitică similară.

Screening virtual

Screeningul virtual  este o procedură de calcul care implică parcurgerea automată a unei baze de date de compuși chimici și selectarea celor despre care se prevede că au proprietățile dorite. Cel mai adesea, screening-ul virtual este utilizat în dezvoltarea de noi medicamente pentru a căuta compuși chimici cu tipul dorit de activitate biologică.

Sinteză pe computer

Sinteza computerizată  este un domeniu al chimioinformaticii, acoperind metode, algoritmi și programe de calculator care le implementează, asistând chimistul în planificarea sintezei compușilor organici, prezicerea rezultatelor și proiectarea de noi tipuri de reacții organice bazate pe generalizarea datelor privind transformările sintetice cunoscute.

Vizualizarea și explorarea spațiului chimic

Una dintre sarcinile centrale ale chimioinformaticii este vizualizarea și cartografierea spațiului chimic, navigarea și identificarea zonelor neexplorate din acesta [7] . Analiza spațiului chimic se bazează de obicei fie pe reprezentarea obiectelor chimice (structuri și reacții) ca vectori ai descriptorilor de dimensiune fixă, fie pe descrierea obiectelor chimice folosind grafice moleculare. În acest din urmă caz, arborii cu schelete moleculare sunt adesea folosiți pentru a reprezenta spațiul chimic.

Proiectarea moleculară a compușilor chimici cu proprietățile dorite

Una dintre cele mai importante sarcini ale chimioinformaticii este proiectarea moleculară a compușilor chimici cu proprietățile dorite. Aceasta se referă la generarea direcționată de structuri de compuși chimici (grafice moleculare), care, în conformitate cu anumite modele, trebuie să aibă una sau un set de proprietăți predeterminate. Când se utilizează în acest scop modelele QSAR și QSPR, obținute ca urmare a căutării relațiilor cantitative structură-proprietate , atunci se vorbește de „QSAR invers”, „QSPR invers”, sau rezolvarea unei probleme inverse în problema structură-proprietate [ 16] . Aceste abordări se bazează pe utilizarea generatoarelor de grafice moleculare. Când se utilizează un model fizic care descrie interacțiunea ligand-proteină, se vorbește despre metode de proiectare a structurii chimice de novo.

Reviste științifice

Vezi și

Note

  1. 12 F.K. _ maro. Capitolul 35. Chimioinformatica: ce este și cum influențează descoperirea medicamentelor  //  Rapoarte anuale în Med. Chim. : jurnal. - 1998. - Vol. 33 . — P. 375 . - doi : 10.1016/S0065-7743(08)61100-8 .
  2. 12 Brown, Frank . Opinie editorială: Chemoinformatics – o actualizare de zece ani  (engleză)  // Opinia curentă în Drug Discovery & Development : jurnal. - 2005. - Vol. 8 , nr. 3 . - P. 296-302 .
  3. 1 2 Gasteiger J. (Redactor), Engel T. (Redactor): Chemoinformatics : A Textbook . John Wiley & Sons, 2003, ISBN 3-527-30681-1
  4. 1 2 Gasteiger, Johann (ed.) Manual de chimioinformatică . De la date la cunoaștere. Wiley-VCH, Weinheim, 2003, în 4 volume, ISBN 3-527-30680-3
  5. 1 2 Varnek A., Tropsha, A. Chemoinformatics Approaches to Virtual Screening , RSCPublishing, 2008, ISBN 978-0-85404-144-2
  6. Varnek, A. Chemoinformatics: recunoaștere prin predare. Prezentat la cea de-a 235-a întâlnire națională ACS. New Orleans, Louisiana, 6-10 aprilie 2008
  7. 1 2 3 Alexandre Varnek și Igor Baskin. Chemoinformatica ca disciplină de chimie teoretică  (engleză)  // Informatica moleculară  : jurnal. - 2011. - Vol. 30 , nr. 1 . - P. 20-32 .
  8. Declarația lui Obernai
  9. A. R. Leach, V. J. Gillet: O introducere în chimioinformatică . Springer, 2003, ISBN 1-4020-1347-7
  10. 1 2 3 Majidov T.I., Baskin I.I., Antipin I.S., Varnek A.A. Introducere în chimioinformatică: manual. Partea 1. Reprezentarea pe computer a structurilor chimice , Kazan: Universitatea din Kazan, 2013, ISBN 978-5-00019-131-6
  11. 1 2 Majidov T.I., Baskin I.I., Varnek A.A. Introducere în chimioinformatică: manual. Partea 2. Baze de date chimice , Kazan: Universitatea din Kazan, 2015, ISBN 978-5-00019-429-4
  12. Baskin I.I., Majidov T.I., Varnek A.A. Introducere în chimioinformatică: manual. Partea 3. Modelare structură-proprietăți , Kazan: Universitatea din Kazan, 2015, ISBN 978-5-00019-442-3
  13. Baskin I.I., Majidov T.I., Varnek A.A. Introducere în chimioinformatică: manual. Partea 4. Metode de învățare automată , Kazan: Universitatea din Kazan, 2016, ISBN 978-5-00019-695-3
  14. J. Bajorath, Chemoinformatics: Concepts, Methods, and Tools for Drug Discovery , Humana Press: Totowa, New Jersey, 2004, ISBN 1-58829-261-4
  15. T.I. Oprea, Chemoinformatics in Drug Discovery , Wiley-VCH, 2005, ISBN 3-527-30753-2
  16. I. I. Baskin, E. V. Gordeeva, R. O. Devdariani, N. S. Zefirov , V. A. Palyulin, M. I. Stankevich. Metodologie de rezolvare a problemei inverse în problema conexiunii „structură-proprietate” pentru cazul indicilor topologici  // Dokl. - 1989. - T. 307 , nr 3 . - S. 613-616 .

Link -uri